第1回 統計をベースとしたデータサイエンスの可能性

技術の進展やグローバル企業によるサービス開発などを背景として世界的にデータ活用への関心が高まる中、全国の大学ではデータサイエンス教育を推進すべく、学部学科の新設、また研究所・センター等機関の設立により様々な取り組みがスタートしつつあります。
こうした現状を踏まえ、本学園データサイエンス研究所では「データサイエンスのフロンティア」と題したインタビューシリーズを開始します。初回となる今回は、武蔵大学社会学部グローバル・データサイエンスコース(GDS)の庄司昌彦教授が横浜市立大学データサイエンス学部学部長 岩崎学教授(本学園データサイエンス研究所アドバイザリーボード)を訪ね、横浜市立大学におけるデータサイエンスの教育の取り組みや、今後の社会におけるデータサイエンスの可能性についてお話をうかがいました。

プロフィール

データサイエンス研究所対談

左:岩崎学(いわさきまなぶ)

横浜市立大学データサイエンス学部学部長。教授。理学博士。
1952年静岡県生まれ。1977年3月、東京理科大学理学研究科修了。1977年4月、茨城大学 工学部情報工学科助手。1984年4月、防衛大学校数学物理学教室 講師。1987年10月、防衛大学校数学物理学教室助教授。1993年4月、成蹊大学工学部経営工学科助教授。1998年4月、成蹊大学理工学部情報科学科教授を経て、2018年4月より現職。

右:庄司昌彦(しょうじまさひこ)

武蔵大学社会学部メディア社会学科グローバル・データサイエンスコース(GDS)教授。
1976年東京都生まれ。2002年、中央大学大学院総合政策研究科博士前期課程修了。修士(総合政策)。2002年、国際大学グローバル・コミュニケーション・センター研究員。2015年、同准教授・主任研究員。2018年、同准教授・主幹研究員を経て、2019年4月より現職。2015年より総務省地域情報化アドバイザー、2016年より内閣官房オープンデータ伝道師。

横浜市立大学における「データサイエンス」とは?

庄司教授(以下、庄司):ちょっと大きな問いで恐縮なのですが……岩崎先生の考えていらっしゃる「データサイエンス」とはどのようなものでしょうか?ひと口にデータサイエンスといっても研究者によっても、大学によっても、それぞれ特徴があるように思います。

岩崎教授(以下、岩崎):それはあるでしょうね。

庄司:最近私は各大学のデータサイエンスについてのカリキュラムを参照したりしているのですが、例えば有名な滋賀大学では経営の話が入るなど、地域・企業との連携を重視しています。

岩崎:滋賀大学はもともと経済学部、教育学部と文系の学部がある大学だったので、新設されたデータサイエンス学部についてもそれに倣(なら)った形になったのでしょう。

庄司:そうですね。それに対して横浜市立大学の場合はかなり理工系色が強いものですね。

岩崎:こちらの成り立ちは、基本「数学」「情報」を扱う学部を中心にして新しいものを作ろうという話でしたから。文理融合とはよくいわれますし、我々もそう言っていましたけれども、本学の場合は理系の先生が7~8割ですから確かに理系色は強いですね。

庄司:岩崎先生は統計学のバックグラウンドをお持ちですが、統計学とデータサイエンスはどういう関係になるでしょうか?

データサイエンス研究所対談
岩崎:私はもともと統計学者です(笑)。データサイエンスといっても大学ごとに特徴があって、本学の場合には統計学にフィーチャーしています。例えば、滋賀大学にお話を伺ってみると、統計の専門家の比率はそれほど高くなく、経済・経営など文系の先生方もけっこういらっしゃるようです。

本学には十数名教員がおりますが、その三分の二ぐらいは統計学の人間です。統計学といってもいろんなジャンルがありますから、工業製品の「品質管理」、本学には医学部がありますから「医薬」、「マーケティング関係」とか「情報科学」だったり。しかし、ジャンルは違えども、統計学を背景とした人が多いのは本学のデータサイエンス学部の特徴といえるでしょう。

冒頭の「データサイエンスとは?」という問いに答えるのであれば、「統計学に情報科学を加えて、そこから得られた知恵・知識を社会に生かしていくこと」というのが回答です。「社会の役に立とう」という実学志向であることが大事だと思います。

少なくとも教員はそのような意識を持って取り組んでいます。まだ1・2年生しかいませんので、彼らがどこに就職してどのような活躍をするのかは未知数ですけれどもね(笑)。

庄司:なるほど。それが横浜市立大学のデータサイエンス学部の理念なのですね。

データサイエンスが活躍する社会になるには「スキルアップ」も必要

データサイエンス研究所対談
庄司:私の専門分野でいいますと、最近「EBPM」(Evidence-based Policy Makingの略:エビデンスに基づく政策立案)という言葉が使われるようになっています。

岩崎:もともと医薬業界で使われていた「EBM」(Evidence-Based Medicineの略:根拠に基づく医療)から派生した言葉ですね。

庄司:はい。医療の世界でエビデンス(根拠・証拠)に基づくことが非常に重視されるようになってきて、それが政府や地方自治体の政策決定にも求められるようになっています。こういった部分もデータサイエンスが引き受けることになってきていますね。実際私もそのような相談を受けます。

データサイエンス研究所対談
岩崎:ただ、統計の人間からすると過去のデータからできることというのは限られています。大事なことは、どのようなデータを使うのか、そこに人間の知恵を加えていかにEBPMに結びつけるかでしょう。
我々ができることは「過去の知見をどう生かすか」です。テクノロジー的なところのお手伝いはできるけれども、それをどう使っていくのかは政策決定する人が決めないといけないですね。

庄司:岩崎先生は地方自治体から相談を受けたりされますか?

岩崎:そうですね。本学は横浜市立ですから横浜市からのご相談もありますし、先日は、他の県のある自治体から相談を受けました。「皆さんがエクセルに入力したデータがあるわけですから、それを生かす方法を考えましょう」といった話をしてきました。思うのは役所の方々のスキルが少し弱いかもしれませんね。それを少しでも高めてもらうことができればデータサイエンスはもう少しお役に立ちやすくなるかもしれませんね。

庄司:膨大なデータを扱う前に、「論理的、科学的な思考」について社会全体で底上げ、スキルアップをしていくことが必要です。EBPMを全国で行ったりビッグデータを実際の政策決定に生かしたりできるようになるにはまだまだかかるかもしれません。
先ほど先生が挙げられた「工業製品の品質管理」であれば、やはり科学的な根拠、プロセスが重視されるでしょうし、データサイエンスのアプローチも行いやすいものですか?

岩崎:物作りをする人にとっては物理モデルが金科玉条なわけです。「この製品のココはこうならなければならない」とかね。統計モデルは「こうなる可能性が高い」といった、ないものを予測するものですから、現場の人とは相容れなかったりします(笑)。現場の人が統計については苦手だったりしますしね。
しかし、確固たる物理モデルがあるからこそ統計モデルが作れるという視点もあります。ただ社会科学の場合にはそのような物理モデルがありませんでしょう?

庄司:なかなか難しいですね……。データサイエンスとは、という話に戻しますと、データサイエンスといってもさまざまな要素を含んでおり、非常に広い分野と関わっています。

岩崎:今はAI、SNS、ビッグデータ、ディープ・ラーニングなどがはやっていますけれども、その一方で古典的な品質管理や医薬などもあり、その全てが対象になります。もちろん政策決定、経済モデルなども入ってくる。
古典的といいましたが、物作りの現場ではセンサーの発達によって昔は計測できなかったデータがたくさん取れるようになっています。どんどんデータが出てくるわけです。ドメインを切ってさばいていかないと、とてもユニバーサルにはいかないですよね。
もちろん学生には「正規分布」は教えますけれども。ユニバーサルな知識ですからね。でも、それぞれのドメインでそのユニバーサルな知識の当てはめ方は変わってくるわけです。大変だと思います。

庄司:どんどんデータが取れる社会になっているわけですね。実際、「オープンデータ」※といった考え方も出てきて、徐々に扱えるデータは増加してきています。データサイエンスとの関わりについて社会に求められることはどのようなことであるとお考えですか?

岩崎:とにかくデータがあふれているわけで、先ほどの自治体の話ではありませんが、データを分析するための基礎体力をもっと世の中全体が身に付けるようにしないといけないでしょうね。

※オープンデータ
著作権やデータ形式によって制限を設けることなく、誰もが自由に使用・編集・共有などができるデータ。またはそれらを増やしていこうとする政策や社会運動。

データサイエンス研究所対談

地方自治体や企業と連携、社会展開に向けた教育

庄司:データサイエンスの成果を社会展開することが求められていますが、そのための教育についてはどのようにお考えでしょうか?

岩崎:もともと統計学というのはそのような学問なので全く違和感はありません。統計学は、数学の知識だけを学ぶのではなく、それを使って現場のニーズに応えるものですからね。

庄司:統計学はもともとの出自が応用を考える学問であるということですね。学生にそのような実践的な知識を身に付ける場を設けたりなどはされていますか?

岩崎:最近はPBL(Project Based Learningの略:問題解決型学習)といわれますね。現在は2年生までしかいませんが、3年生になったら夏休みなどにインターンとして企業に送ろうというプログラムを今計画中です。現場を見てくるというのは極めて大事なことですし、現場が分かるとまた勉強にも身が入ると思います。

庄司:学生の将来、就職先などにも影響があるでしょうね。

岩崎:これまで統計学は専門の学部はないし、統計学を学んだからといってどこに就職できるというのは特にありませんでした。ところがデータサイエンスとなると、IT系のみならずマーケティングであるとか、そのような就職先も出てくるわけです。
企業側でもデータサイエンスについて知識のある人材を望んでいます。ただ企業もまだ慣れていなくて、そのような人材を企業内でどのように生かしていくのか戸惑っている感じはあります。

庄司:どんな企業連携をされていますか?

岩崎:8つぐらいの企業と連携協定を結んでいます。取り組みの一つとしては、いろんな企業に来ていただいて1週間に1コマ(90分)ですがお話を伺っています(前期)。1年生は数学の勉強ばかりだとつまらないと思うので(笑)、現場がどう考えているのかを知る機会を設けているわけです。
3年生になったら、先ほど申しましたがインターンとして今度は現場に行かせると。これはまだ先のことになりますが、企業との共同研究も視野に入れています。
企業の問題解決に当たることも、大変そうですが、できるかもしれません。ただ、まだ学部も立ち上がったばかり、教員もいっぱいいっぱいなところがありますので、もう少し時間が必要でしょう。

庄司:横浜市は、国会での「官民データ活用推進基本法」の成立を受け、全国に先駆けて「官民データ活用推進基本条例」を定めました。市役所や市内の企業との関係はいかがでしょうか?

データサイエンス研究所対談
岩崎:横浜市と大学とでデータの活用の協定を結んでいますので、私たちデータサイエンスの人間が、職員のスキルアップに貢献する、例えば講演会を行うとか、セミナーを実施するとか、そのような活動をします。
また、学生の勉強のために市の持っているデータを活用させてもらっています。市と大学が協力して街づくりを進めようというイメージですね。総務省が「データの利活用」の旗振りを行っていますが、それに沿っての動きです。
市内企業との連携も始まっています。横浜市の企業というと日産自動車が有名ですが、やはり連携協定を結びまして。今度学会があるのですが、そこに日産の人に来てもらったりします。他にも帝国データバンクというデータをたくさん持っていらっしゃる企業がありますが、やはり連携協定を結んでいます。

庄司:すでにいろいろな取り組みが始まっているのですね。

岩崎:はい。「Women in Data Science」、略して「WiDS」(ウィズ)というのですが、これはスタンフォード大学が旗振りをしている「性別に関係なくデータサイエンス分野で活躍する人材を育成しようとする取り組み」です。WiDSのアンバサダーに本学の小野陽子准教授が日本で初めて就任し、シンポジウムをすでに4回日本で開催しています。
シンポジウムにもいろんな企業が参加していますから、これも企業との連携といえるでしょう。シンポジウム内で行われた「アイディア・チャレンジ2019 WiDS TOKYO@YCU」では、本学部の学生が最優秀賞を獲得しましたよ。

庄司:それはすごいですね。1、2年生ですか?

岩崎:はい。「データを活用した次世代の新しい働き方」というテーマでしたが、うちの女子学生チームが頑張った結果が評価されたようです。
→横浜市立大学「データサイエンスの未来を創造する祭典WiDS Tokyo@Yokohama City Universityを開催!」

庄司:他大学・他学部との連携はいかがでしょうか?

岩崎:徐々に進めています。文部科学省が旗を降って「全学的にAIやデータサイエンスに取り組みましょう・教育しましょう」という話になっていますが、そもそも統計学の専門家が全国的に足りないと思います。
うちは(統計学者が)いる方なので「何言ってんだ、お前のところにはいるじゃないか」なんていわれそうだけれども、全国的にリソースが足りないわけだからそもそも大学ごとに教育できる場を整えることが難しい。連携の前に、連携できるだけの状況をつくらないといけないでしょう。
それには学生の意識も向上させないといけない。先生が言うだけでは進みませんからね。
私たちは統計の人間なのでAIもデータサイエンスも同じだと思っていますけれども、ただデータサイエンス学部という受け皿だけ作っても学生の意識が変わるわけではないし、文理融合というのも含めて、掛け声だけでは変わりません。今は難しいですが、意識も変えていって「これから」ではないでしょうか。

武蔵大学におけるデータサイエンスへの期待

データサイエンス研究所対談
庄司:武蔵大学のデータサイエンスについてご意見をうかがいたいと思います。人文社会科学系の学部だけで構成している大学でデータサイエンスに取り組むということで、扱う対象においても、アプローチにおいても、独自の立ち位置をつくることができるのではないかと私は思っています。

データサイエンス研究所対談
岩崎:なるほど。「ゼミの武蔵」といわれていらっしゃいますしね。やる気のある学生を少人数でチームにして、武蔵大学の得意なところでやっていくのが良いのではないですか。
文系と理系、数学についてのリテラシーが問題になっているのかもしれませんが、統計学で使われる数学はほとんどが中学レベル、難しくても高校レベル止まりで、実はそれほどハードルは高くありません。四則演算が中心ですから。

庄司:そうなんですよね。それほどハードルは高くなく、さまざまな入り口がありますから、学生にはデータサイエンスへの興味を持って、自分なりのかかわり方を見つけていってほしいと思います。

岩崎:文理融合といわれますが データを分析するために「カイ二乗統計量」「オッズ比の計算」などはできないといけないし、エクセルの使い方も含めて基本的なことは学ばないといけないでしょう。難しく思えるかもしれませんが、四則演算中心ですから文系の学生にも十分対応できます。
また、基本知識をデータにどのように当てはめるかについては文系も理系もありません。「見方の問題」ですからね。センスの問題であるともいえます。ですから、武蔵大学ならではのデータサイエンスを追求していかれるのが良いのではないでしょうか。人文科学に新しい知見をもたらす可能性があるのではないですか。

庄司:そうしていきたいですね。本日はありがとうございました。