貼り付け開始
MIT Technology Review
大量の論文要旨を自然言語処理で分析、新材料発見の可能性 --------------------------------------------------------------
https://www.technologyreview.jp/nl/ai-analyzed-3-3-million-scientific-abstracts-and-discovered-possible-new-materials/ 2019.07.11
自然言語処理が、科学的発見を加速する可能性を示す新たな論文が発表された。
単語間の関連性の把握に非常に長けた教師なし学習の技法の発達のおかげで、
自然言語処理は近年、大きな進展を遂げている。
これらの技法では、単語同士が相互の関連において
どれくらいの頻度でどれくらい密接に使用されているかを計測し、
3次元ベクトル空間にマッピングする。
その結果得られたパターンは、「 男性でいう王は、女性でいうと女王だ 」
といった基本的なアナロジーを予測したり、文を組み立てたり、
自動補完や他の入力予測システムを強化したりするのに使われる。
ある研究者グループはこうした自然言語処理の技法を利用して、
1922年から2018年までに学術誌に掲載された、
材料科学の研究を含むと見られる科学論文330万本の要旨を分析した。
結果として得られた単語間の関係性は、
元素周期表の構造や化学物質の構造が物質の特性とどう関係しているかなど、
材料科学分野の基礎的な知識をとらえた。
この論文は先週のネイチャー誌に掲載されている。
アナロジーを計算できるおかげで、熱電材料と似た性質を示すものの、
これまでそうした観点で研究されていなかった化合物も多数発見された。
研究グループは今回の手法について、
既存の科学文献ではこれまで考慮されていなかった相関性を見つけ出し、
材料科学分野の研究を加速させる新たな方法となるかもしれないと考えている。
大量のテキストの中から、魅力的な、時には予想だにしないような関係を発見する
このような手法が使われるのは、今回が初めてではない。
たとえば、2017年には、今回と同様の手法を用いて
インターネット上のテキストに基づく膨大なコーパスを処理したところ、
人種と性別に対する人間の歴史的なバイアスが再現され、
さらに職業別の男女比まで算出できたと報告する論文がサイエンス誌に掲載されている。
こうした論文は、人間の言語の中に私たちの世界に関する豊かな情報が
いかに多く含まれているかを示している。
私たちは今、機械学習によってその知識を得るツールを手にしつつあるのだ。
セミナーではよく話してるが、「 思考 」は、脳内で言語で行われている。
「 直感 」は、記憶パーツを、普段結線しないシナプス回路を用いたり、
「 共感覚 」的異領域結合によってもたらされる。
「 思考 」は「 認識 」の後にもたらされるが、上記の研究は
まさにAIが「 認識 」から「 思考 」の段階へ移行しつつあることを示している。
「 思考 」の重要なパーツである言語は現在、
電電公社の携帯メールやCメールから、TwitterやSNSによって
文章が超縮小化され、用いられる単語も安易化・愚直化されてきた。
これはつまり、「 思考 」を司る/構成する豊かさの減少そのものだ。
特にニッポンに於いては、GHQ文盲省:Mr.ゆとり教育寺脇研の
白痴化教育の成果もあり、「 思考 」から「 反応 」へと進化して来ている。
かつては、句読点の「 。」を使わず、どれだけ長くて論理的に優れた
文章が作れるかを特に哲学分野では競ってきた。
これまで読んだ中では、単行本の哲学書で、3ページ半に亘って
ひとつの文章と云うのが一番長かっただろうか?
たしか、エリアーデの本だったような気がする。
象徴・ART・宗教のルーマニアの哲学者だ。
「 ダ・ヴィンチ・コード 」の著者ダン・ブラウンの
ロバート・ラングドン・シリーズに登場する主人公ラングトンは
象徴学の教授だが、エリアーデの知見をベースにしてるように思われる。
関連情報
< newsNueq-1632:バイドゥが機械「 同時通訳 」の道開く >
< newsNueq-2081:AI、全国連演説をわずか13時間で捏造可能 >
< newsNueq-2080:「フェイク音声」時代到来?:FB研究員が作ったゲイツそっくりさん >
< newsNueq-278 :自己学習して突き進む DeepMind の AIフィギュア >
< newsNueq-1987:ニューロンとシナプスの動作を再現する素子:東北大学 >
< newsNueq-1331:カーボンナノチューブで脳機能の一部を再現 > 九州工業大学
< newsNueq-1634:ニューロンは遺伝子の発現によって「経験を記憶」している >
< newsNueq-1709:脳辞書 brain dictionary ブレイン・ディクショナリー >
< newsNueq-1213:「文章を読めない人」- 日本の生産性を引き下げている原因 >
< newsNueq-660 :誰もスカウトしない日本人設計者 >
< newsNueq-1991:パソコン普及率が低すぎる日本の憂鬱な未来 >
< newsNueq-907 :日本は世界の底辺国…学校デバイスとジョブスの子どもたち >
< newsNueq-415 :国際AI学会を席巻する中国 日本は後進国入り寸前 >
< newsNueq-813 :スマホと云うバカ製造機:西部遭氏、入水 >
< newsNueq-1204:スマホが使えないバカ、使う大バカ >
< newsNueq-1879:スノーデン上司が暴露:馬鹿フォン・スマ阿呆データは操り人形♪ >
< newsNueq-948 :ダボスの主題は「 AI専制政治 」だった >
< newsNueq-999 :白蟻化から大腸菌化へと向かう人類 >
nueq
貼り付け終わり、ニュークさん解説。
*これ大事な認識事項です!
- 関連記事
-