原発報道の変遷 AIで分析 東日本大震災後、意識変化軸に

西日本新聞 オピニオン面 塩田 芳久

 西日本新聞社は、福岡市のIT企業「グルーヴノーツ」(最首英裕社長)と人工知能(AI)研究の一分野、自然言語処理の技術で平成30年間の新聞記事を分析する共同研究を行った。記事で使われた単語同士の近さを数値化する「単語ベクトル」を生成し、「原発(原子力発電所)」と関連性の高い単語を平成30年間の記事から抽出して年を追ってどう変化したか分析した。設置の賛否を巡る人々の動向と、東日本大震災(2011年)を境にした意識の変化を軸に報道してきたことが客観的に確かめられた。

 単語をベクトル化(数値化)することで、文章中に含まれるある単語が、どのような単語と一緒に使われるか、傾向がつかめる。今回は「原発」という単語に対して数値が近い、すなわち一緒に使われることが多い単語をランキングにした。

 連綿と続けている原発報道だが、舞台は移り変わった。1990年、「原発」と一緒に使われた単語は、山口県上関町で計画された上関原発に関するものが上位を占めた。計画主体の「中国電力」、予定地の対岸で反対運動が起きた「祝島」などだ。95年は九州電力の原発立地候補地に浮上した宮崎県串間市が“主舞台”に。「反対派」「反原発」「住民投票条例」などの単語とともにニュースを伝えた。この年の12月、九電は計画の「凍結」を表明、以降「原発」と「串間」のつながりは薄れてゆく。

 2000年は前年に起きた茨城県東海村の臨界事故の影響を追った。この頃まで「反原発」「原発推進」ともランクは上位だった。05年は九電が玄海原発(佐賀県玄海町)に導入を目指したプルサーマル計画を巡る動きが中心。10年も国の政策「核燃料サイクル」に関連する単語が「原発」とともによく使われた。

 東日本大震災で福島原発事故が起きた11年以降、これまで上位になることが少なかった「脱原発」と「避難計画」が「原発」と関連性の高い単語として散見されるようになった。核エネルギーに依存しない考え方、そして「もしも」への備えは東日本大震災後、より身近で切実になってきたようだ。一方で05年以降、「反原発」は上位20に1度出てくる(18年)だけで、「原発推進」は姿を消した。

 ●「平成」どんな言葉で報じたか 本紙記事「単語ベクトル」で分析

 西日本新聞社と、福岡市のIT企業「グルーヴノーツ」による平成30年間の新聞記事分析は、自然言語処理の技術がベースにある。この技術で生成した「単語ベクトル」を活用し、「西日本新聞は平成30年間をどんな言葉で報道してきたか」を客観的に示すことを目指した。

 自然言語処理とは、人が日常使う言葉をコンピューターで処理する技術。身近な応用例として、パソコンのかな漢字変換や自動翻訳機能などがある。

 共同研究では、1989年1月~2018年7月に西日本新聞に掲載された記事221万本(事件事故や社外配信の記事を除く)をグルーヴノーツが処理。すべての記事を単語に分割した上で、主要な面(ページ)と年のデータを抽出。複雑な計算をして単語をベクトル化した。

 「西日本新聞はどんな言葉で平成を報道してきたか」を説明するとき、単語の出現頻度(使われた数)を示すことがまず考えられる。一番使われた単語は「九州」で次は「福岡」、といった具合に。だが、それで分かるのは一つの単語の大きさ(出現頻度)だけ。どんな文脈で、ほかの単語とどう結び付いて使われるかは見えてこない。

 単語をベクトル化すると、大きさに加えて向きを持った数値として表すことができる。ある単語の周辺にどのような言葉があるか(一緒に使われているか)を図に示すマッピングなどが可能になるのだ。

 ただ原発と一緒に使われた単語のランキング表を見ると、意外性はない。原発に関連した年表があるならば、必ず出てくるような単語と、ランキングにある言葉は多くが重なるはずだ。現段階で単語ベクトルは、使われると予測される単語が実際に使われていることを客観的に確認する手段として私たちは紹介している。だが活用法はそれだけではない。

 単語ベクトルを活用した身近な事例として、ネットショッピングのレコメンド(推薦)機能が挙げられる。ある商品を買った人に、ショップ側が関連のある商品を「こちらもどうですか」と提案する機能だ。新聞の分野でも、あるキーワードを含んだネット上の記事を読んだ人に、そのキーワードとベクトルの値が近い(つながりが深い)言葉を含んだ関連記事を紹介することができるようになる。また単語ベクトルを応用することで、ある記事が楽しいニュースか悲しいニュースか記事の「感情」を分析できるようになるという。単語ベクトルに代表される自然言語処理は、新しい新聞報道のヒントを含んだ技術といえるだろう。 (塩田芳久)

=2019/01/27付 西日本新聞朝刊=

PR

社会 アクセスランキング

PR

注目のテーマ