データサイエンス研究所設立に寄せて 有馬朗人

データサイエンスにかける思い

ふたつの方法論とデータの重要性

有馬学園長
武蔵学園長 物理学者 俳人/元文部大臣 元科学技術庁長官/元理化学研究所理事長
学問の進展においては、二つ大きな方法論がある。ひとつは2017年ノーベル賞の重力波のような問題、とことん本質を見極め、その現象を実証できるかどうか、というアプローチ。理論的検討から、実験の精度を限りなく上げていくという研究態度だ。理論としては重力波というのがあって、それをどういうふうに測定すればよいかとか、理論的にはどういう場合に大きな波が伝わってくるのか、どうすれば観測できるか、そういう推論を積み重ねて精度を上げていくことだ。それに対してもう一つのやり方は、リンネのように植物を観察し、徹底的に分類していく方法だ。

どちらかというと私が原子核物理学でやっていたのはリンネに近い。当時あったデータをすべて調べ上げ、実験値を理論と照らし合わせ、どうなっているかを徹底的に調べ上げた。データを集めると、データが示す不思議な事が出てくる。それまでの理論と合わないところがあり、決定的に合わないところは何が原因であるのか、それも複数の例外があると、実験と理論が合わないところがあることに気づく。そしてそこにそれまでの理論で抜け落ちていた部分を、学部生の最後から大学院へ進学した直後ぐらいで発見し、当時としては内外の専門家の中では注目される理論を修士の時代に打ち立てた。このように、データをきちんとみていくことが非常に大切だということをその時認識した。

また、研究そのものとは別に、研究者の分析もしたことがある。日本ほど科学技術や教育に金を出さない国はない、これをなんとかしなくてはならない、ということで、いったい研究者の活動期はどういう時かということについて、論文の数を調べ上げ、その人たちが、特に物理学だけれど、若い時に一つのピークがあることがわかった。また40~50歳の時にもう一つのピークがあるということを発見した。その時に気づいたことは、こうしたデータの集積が日本にはなかったということ。私が1967か68年頃アメリカに行った時、図書館にはCitation Indexという雑誌があった。驚いたことに世界中の自然科学の研究者の論文がきちんと表になっていて、いくつ引用されているかも全部調べ上げてある。どういう人がどのような研究をしているか、どんな方向に研究が進んでいるか一目でわかるわけだ。また、Chemical Abstractというのもあって、化学の面でも多様な分野が分類されている。これらはすべてヨーロッパだ。ヨーロッパの力というのはそうした自然科学のデータを調べ上げる力であり、どの大学がどういう化学を研究しているか全てわかる。

日本では、科学技術業績データの収集をきちんとやり始めるのが、1980年の半ばころから始まる現・科学技術・学術政策研究所(NISTEP)だ。ここで情報を集めるようになり、科学技術動向を分析し始めた。このようにデータを集積し、その中にあるエッセンスを探り出す能力は、もともとはヨーロッパが非常に強い。特にドイツ、イギリスだ。

また、昔は目や手で調査し本にしていたのが、今では全部コンピュータに収まり、ネットワークとコンピュータで世界中から情報を集めて表にしているわけだ。これは科学だけではない、事実、データを集め分析することで、どんなものが売れるかなどということも情報化されているし、社会のあらゆることが情報化されている。

正岡子規は“データサイエンティスト” だった

そこで私はどう考えたかというと、こうした多くのデータを見ることによって新しい科学も生まれてくるだろうと思う。またこれは、社会科学でも出てくるだろうし、文学のような分野でも新しいものが生まれる可能性がある。実は、日本人はこのようなことをやったことがある。それは正岡子規。子規はそれまであったあらゆる俳句を分析した。江戸時代、明治時代に作られた俳句を全部分類し、そしてどういう方向に俳句が今後いかなければならないか、文学がどう伸びていかなければならないかを見て、「写生術」を持ち込む。写生術は単に俳句や短歌だけでなく文学にも応用されていくことになる。これは「俳諧大要」(1895~)としてまとめられている。文学においても、それまでの作品を分析することによって、日本の文学に欠けていたものは何か、彼は、それは写生術であると結論づけた。絵画でやっている写生術をヨーロッパから導入し、俳句を革新し、短歌を革新し、そして小説も革新した。その小説の革新の最初が、子規の親友中の親友、夏目漱石だった。これを見ていると子規は創作の裏側には人文学者としての面があったと思う。

だから日本人もやれないわけではない。日本人もデータをきっちり処理できる力を備えるべきである。しかし、世界中がビッグデータ、ビッグデータと騒いでいる時こそ、日本が尻馬に乗るだけでなく、独自のものをやらなければならない。自然科学分野のデータサイエンスは皆知っているが、重要なのは、日本でオリジナリティーが発揮できるところは人文・社会を動員することだ。要するに、人文・社会系の人、いわゆる文科系の人がビッグデータに正岡子規のように着目して、そこから新しい産業はどんなんものがあるか、新しい時代にはどういうものが要求されるかをやるべきだ。そのためにはビックデータを人文科学的、社会科学的な目で見、データから何を引き出すかを研究しなければならない。また、どのようなデータをとったらいいかも分析することが必要。医学は非常に進んでいる。病気と行動の因果関係を探るなどはもう一般的だ。医学情報が大きく進んだことによって今やっと痴呆症はどうすればいいかなど、新しい治療法も考えられている。

そして、こうしたことは、より広い分野へ波及すべきで、これからは、科学者、医学者、工学者だけではなく、やはり社会科学や人文社会の人がこういうことに興味を持ち、これから進めていくべきだということだ。

私の意を汲んでいただき、武蔵に人文系、社会科学系のビッグデータサイエンスの研究をしよう、教育をしようと勢いが出たということは、素晴らしいことだと思う。日本中見てもまだ文系がやっているところはほとんどないだろう。人文科学、社会科学が協力して、社会への要請、経済学への応用、こういうことにビッグデータを応用していけば素晴らしいことになるだろう。しかも、それは西洋ではできない領域になるかもしれない。

西洋から見ると東洋の人の気持ちはわからないとも言われる。ところが日本は西洋、中国、アジア諸国にも関心を持っている。アジアという特別な地位を利用しながら、韓国、中国、そしてインドというきわめて大きなマーケットもある。みな共通の気持ちをもっている。と同時に、ヨーロッパ、アメリカの文化に対しても日本人の関心は高く研究能力もある。ユニークなところは、それこそ武蔵の東西文化の融合という教育の三理想の一つであって、武蔵は日本の中では向いているし、世界的に見ても日本の持っている特徴を生かすべきだ。

風土を活かした新しい研究や教育を

日本の物理学者の強みは対称性を破るのが平気なこと。自発的対称性の破れを発見したのは南部先生だ。世界は物質でできているけれど、物理学の鉄則に依れば反物質と物質は平等にできるのに、どうして物質だけ残っているのか、それを予言してノーベル賞をもらったのは小林・益川先生。左右の対称性の破れがあってもかまわないと言ったのはヤン先生、リ先生。中国出身でアメリカの人。東洋人は対称性破っても困らない。ところがヨーロッパ、ベルサイユ宮殿などに行ってみれば、完全に左右バランス型の庭。こういうのは日本にはない、東洋には対称な庭はほとんどない。東洋人のよさというのは対称性を壊すのが平気なところ。ヨーロッパの人は頑として対称性を守る。人間の持っている本能の中に、どことなくヨーロッパ人らしさ、日本人らしさがあって、見事にあらわれたのが対称性の破れの発見。

自然科学でも他のことでも、絵でもそうだろう、風土性はあるけれど、世界的な視点も持つことが必要ということだ。母国愛、祖国愛なんて大きなことは言わないけれど、風土に生まれた、育ったということは大切にしたい。データサイエンスでも必ず風土にあったものがあると思う。一方で世界に共通のものもあるわけで、これは両方にらんでやっていかなければならない。

(2017年10月27日 談)
有馬朗人学園長は、2020年12月6日に逝去されました。