情報処理学会第81回全国大会中高生ポスターセッション発表

手書き数字の判別システム作りを通して人工知能の仕組みに迫る!

山口県立岩国高校 杉本正飛くん(2年)

左が杉本くん
左が杉本くん

 

手書き数字識別判別システムの構築と読み取り実験

僕の班は、パソコン上に書かれた手書き数字を読み取り、それが設定した数字であるかどうか判定する文字判別システムの構築を行いました。今回は、似ている文字が多い「9」に絞って研究を行いました。僕たちは、一から自分たちで判別方法を考え、大量の基準データと比較していくことにしました。

 

方法は次の通りです。

  (1)人の目で、9とみなせるもの(基準データ)をたくさん書き、蓄える。

  (2)すべてのデータの余白部分を切り取り n×nに区切る。

  (3)各マスを文字が通っているかどうかで0と1に置き換え、比べたいデータと基準データの0と1の合致率を調べる。

  (4)合致率が閾値を越えたとき合致したとし、その枚数が閾値を超えたとき、比べたいデータを9とみなす。

 

以上の(2)~(4)を行うシステムを構築し、最適な「n×n」、「名閾値」を実験によって求めていきました。その結果、3段階の閾値を設け、いずれか1つを満たせば、9とみなすことにしました。

 

しかし、このシステムは班員の筆跡に依存しており、ある程度は正しく判別できるものの、完璧ではありませんでした。ただ、僕たちはこの研究により、既存の文字判別システムをはじめとする学習型人工知能の偉大さに気づくことができました。そして、一つの課題に向けて班員で協力しあって知恵を出し、科学的に考察し、PDCAによって解決していくことは、今後に向けてとてもよい経験になりました。

 

※クリックすると拡大します

■活動を始めた理由や経緯は?

 

課題研究のテーマ決めの時、担任の先生が提案した例の中に今回のテーマがあり、とても興味深かったからです。

 

■かかった時間はどのくらい?

 

毎週1時間の「課題研究」の授業の時間に行いました。実際は2週間に2時間、まとめて実施することが多かった

です。時間が足りなかったので、夏休みに集まったこともありました。

 

■今回の活動で苦労したことは?

 

・人工知能や文字判別システム読み取りシステムについて、下調べをまったくせずに、すべて自分たちで考えたので、先が見えずに試行錯誤したこと。

・約1000枚の基準データを8人の班員で書いたこと。

 

■「ココは工夫した!」「ココを見てほしい」という点は?

 

ただ与えられたデータを判別するだけでなく、処理のようすをモニターに表示するようにしたので、発表時にわかりやすく説明ができました。また、実験するときにプログラムを少し変えて効率化を図りました。

 

■今回のポスター発表の感想をどうぞ!

 

情報処理を専門とする方が集う大会だったので、非常に適確な意見やアドバイスをたくさんいただけると同時に、自分たちの未熟さを知ることができました。そして研究や発表すること、他の班の発表を聞くこと、すべてを楽しむことができ、自分の将来にとってとても意義のある時間を過ごすことができました。

 


※この研究は中高生ポスターセッションの最優秀賞を受賞しました。