HOME 交通アクセス お問い合わせ サイトマップ
ホーム教員紹介情報行動学科>青木繁伸
教員紹介

青木繁伸 (あおき・しげのぶ)教授

青木繁伸

AOKI, Shigenobu

  • 出身地: 香川県
  • 最終学歴/学位: 東京大学大学院医学系研究科博士課程/保健学博士(東京大学)
  • 研究室: 社会情報学部棟406
  • 所属学会: 日本社会情報学会(JSIS),日本公衆衛生学会,日本行動計量学会
  • 専門分野: 統計学,疫学,公衆衛生学
  • 担当科目: 統計学Ⅰ,統計学Ⅱ,社会調査論,プログラミングⅡ,データ解析,社会情報学演習C,情報処理入門
  • 個人ページ: http://aoki2.si.gunma-u.ac.jp/index.html

現在の研究テーマ

専攻分野・研究内容紹介

統計学はどんなところで使われているか

統計学と聞くと,確率のことを思い出したりして,自分は数学は苦手だからできれば避けて通りたいと思う人が多いかも知れません。しかし,統計学はあらゆる科学の基盤を形成する学問なのです。たとえば心理学(教育心理学)の分野で開発された因子分析という手法は,今でも,他の学問分野においても広く使われています。社会情報学部は文科系の学部であると思っている人が多いかも知れません。しかし,その中の経済学の分野は微分・積分を駆使し,経済統計学という難しい科目があります。統計学の中でも一番難しいのが経済統計学だといわれます(私は経済学が全くわかりませんので,経済統計学もちんぷんかんぷんな部分が多いのです)。数学や統計学無くして経済学を修めることはできません(断言できます)。また,経営学の分野でも様々な統計分析手法を使用して研究が進められています。そして当然のことながら,社会情報学部にふさわしい「社会統計学」というのがあります。社会のもろもろを,統計学を道具として解明していこうというのがその目的ですね。

統計学は難しいのか

「統計学は難しい」と言う人が多いのですが,それは一昔前の話です。コンピュータが無かった時代は,全ての計算を自分で行わなければいけませんでした。当然ながら,どのような計算を行わなければならないかは数式で書かれているわけです。皆さんは信じられないかも知れませんが,国産のパソコン(その当時はマイコンと呼ばれていました)が発売されたのは今から30年前(1978年)です。ルート機能の付いた電卓も 3,4 万円していたのです。簡単な計算をすることだけで手一杯で,そのほかのことなど考える余裕がないほどでした。今は違いますね。実際の計算はコンピュータがやってくれるので,自分が知りたいことは何なのか,そのためにはどのような分析をしろとコンピュータに命令すればよいのか,コンピュータが計算してくれた結果をちゃんと読み取るにはどういう点に注意すればよいのかということが重要なのです。難しい数式に悩まされることはなくなったのです。

統計学ではどんなことができるのか

データを分析して有用な情報を取り出すのが統計学です。例を挙げてみましょう。統計学の分野で有名なデータがあります。「フィッシャーのアヤメのデータ」です。フィッシャー(1890〜1962)はイギリスの統計学者で,現代の推測統計学の基礎を築いた統計学者の一人です。彼は統計学のほかにも,集団遺伝学,生物学などにも多彩な才能を持った実務家でもありました。フィッシャーは現代にも受け継がれている様々な統計手法を開発しました。彼の業績の一つとして,同時代のアンダーソンが発表したアヤメのデータ1)を例として取り上げ,系統分類と生物測定の関係について発表した論文があります2)。この業績のために,本来は「アンダーソンのアヤメのデータ」が「フィッシャーのアヤメのデータ」として広く知られたのです。さて,アヤメのデータは表 1 に示すような 3 種類のアヤメそれぞれ 50 個体の花びらとガク(萼)について,その幅と長さの 4 種類の測定値を記録したものです。


表1・フィッシャーのアヤメのデータ

しかし,いくらこの数値だけを見ていても何にもわかりませんね。「平均値を計算してみたらどう」かという提案が聞こえますが,統計学でまずやることはデータを図に表して特徴をとらえることです。4 つの測定値について図 1 を描いてみました。


図1・アヤメの種類による 4 つの測定値の違い

図 1 アヤメの種類による 4 つの測定値の違い


小さな○一つが一つのデータです。水平方向に並んでいる○は同じ値を持つデータです。この図を見ると,ガクの長さ・幅,花弁の長さ・幅共に,右の 2 つ茶色(B)と緑色(C)のデータは重なりが多いことがわかります。それに対して,紫(A)のデータは茶色や緑色のデータよりも際だって小さいことがわかります。ガクの幅は紫のデータが大きい傾向がありますが,そのほかの 3 つのデータでは緑色が一番大柄で,次いで茶色,紫の順になっていることがわかります。では,この 4 つのデータを使って,アヤメの種類の違いを一つの図で表現できるでしょうか。答えは「イエス」で,おまけに何通りものやり方で表現できるのです。そのうちのいくつかを下の方に示しておきましょう。

統計学を使えば,生物学者でないあなたも一流の生物学者と同じように,目の前にある 1 本のアヤメが 3 つのアヤメのうちのどれであるか区別できるのです。

「アヤメなんかに興味はない」という人が多いでしょうが,この手法はどんなデータについても適用できるのです。あなたの興味のある分野のデータに対して,実際にこれらの手法を適用してみませんか?










参考文献

  1. Anderson, Edgar: The irises of the Gaspe Peninsula, Bulletin of the American Iris Society, 59, 2-5, 1935.
  2. Fisher, R. A.: The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7, Part II, 179-188, 1936.

Last Update 2008/08/19