概要
超教育協会は2021年7月7日、株式会社リクルート プロダクト統括本部 プロダクト開発統括室 データ推進室 データソリューション2ユニット まなび領域データソリューション部 部長の山邉 哲生氏を招いて、「EdTech ユニコーンに見る教育 AI 利活用、そしてスタディサプリのこれから」と題したオンラインシンポジウムを開催した。
シンポジウムの前半では、山邉氏が、海外の主要EdTechユニコーンの活動と教育AIの活用パターンについて、リクルートが運営するスタディサプリの活動を交えて講演し、後半では、超教育協会理事長の石戸 奈々子をファシリテーターに参加者を交えての質疑応答を実施した。その前半の模様を紹介する。
>> 後半のレポートはこちら
>> シンポジウム動画も公開中!Youtube動画
「EdTech ユニコーンに見る教育 AI 利活用、
そしてスタディサプリのこれから」
■日時:2021年7月7日(水)12時~12時55分
■講演:山邉 哲生氏
株式会社リクルート
プロダクト統括本部 プロダクト開発統括室
データ推進室 データソリューション2ユニット
まなび領域データソリューション部 部長
■ファシリテーター:石戸 奈々子 超教育協会理事長
スタディサプリ事業で主にデータ分析に携わっている山邉氏は、約40分間の講演において、海外のEdTechユニコーンのAI活用事例を中心に、教育AIの活用パターンを説明した。主な講演内容は以下のとおり。
世界の教育市場を調査・分析しているHolon IQによると、グローバルマーケットにおけるEdTech関連の年平均成長率(CAGR)は、コロナ禍前が13.1%、コロナ禍後が16.3%と、いずれも高い水準にあります。コロナ禍がEdTech市場を伸長させる方向に働いたことがわかります。
▲ スライド1・世界市場におけるEdTech関連の支出額と成長率
Holon IQによると、EdTechユニコーン1位の中国・Yuanfudao(猿輔導:ユアンフータオ)の企業価値評価額は日本円換算で1兆6800億円、2位のインド・BYJU’S(バイジューズ)も1兆4100億円と高く評価されていることがわかります。
▲ スライド2・海外の代表的なEdTechユニコーン
EdTechの「2大」ユニコーン
中国・ユアンフータオとインド・バイジューズ
ユアンフータオは、オンラインのマンツーマンレッスンをはじめ、先生が指導する様子をログインして視聴する「ライブ指導」、わからないところを先生に質問できる「オンラインQ&A」などを提供しているほか、AIを活用したさまざまなアプリケーションを提供しています。
対象ユーザー層は、幼稚園~高校(K12)に加えて、最近は0歳児からの幼児向けサービスも展開しています。このようにまずメインとなるK12層を押さえてからより下の年齢層にサービスを拡張して、中長期的な継続利用を促す手法はユニコーン企業に共通して見られる傾向です。巨大市場・中国のサービスとしてユーザー数も4億人を数え、テンセントが出資していることでも知られます。特にAI研究には力を入れていて、Microsoftや北京大学などトップ校の研究者100名が集まるAI研究所を運営しています。
▲ スライド3・ユアンフータオの企業概要
ランキング2位のバイジューズは、CGやアニメーションを活用したオンライン動画学習をベースに、オンラインチューターなど様々な形態での学習支援を提供しています。ユーザー数は約6400万人で、ユアンフータオと同様にK12から幼児層へと対象ユーザー層を広げてきています。2019年にはシリコンバレーのデジタル教育ベンチャー「Osmo」を買収してコンテンツに取り入れたほか、ディズニーのコンテンツなどの知財を活用したコンテンツも提供しています。
▲ スライド4・バイジューズの企業概要
例えば、生物学の授業では、CGアニメーションと実際の先生の動画を組み合わせたオンライン動画学習を展開しています。
▲ スライド5・アニメーションを活用した生物の授業
また、2019年に買収したOsmoによって、MR(Mixed Reality)を活用した教育コンテンツもバイジューズのコンテンツラインアップに統合されました。
バイジューズのAI活用についてはあまり詳細が語られていませんが、子供の学習状況に応じて学習活動を変化させる個別最適化学習、いわゆるアダプティブラーニングを提供しています。この裏には、単元や質問といった知識モジュール間の関係性を表現する大規模なナレッジグラフがあり、5万以上の知識モジュールをつなげて、それぞれに対応する学習コンテンツを紐付けています。これにより、例えばある単元を子供が間違えた時に、次の単元に進む前に一段階易しい問題を挟んだり、一つ前の単元に戻して理解を定着させてから先に進めたりするようなナビゲーションが可能となっています。
▲ スライド6・個別最適化学習を実現する
バイジューズのAI
2021年の6月には、Googleとのパートナーシップ締結を発表し、その中で、もともとバイジューズが買収・運営していた生徒・教師向けプラットフォーム「Vidyartha」へのログインを通してGoogle Workspace for EducationやGoogle Meetとのシームレスな連携を提供することなどが挙げられています。
外国語学習のEdTechユニコーン
米国・デュオリンゴ
次の「Duolingo(デュオリンゴ)」は、アメリカの企業で企業価値は約2600億円です。サービス内容は第2外国語学習のためのコンテンツやアセスメントで、対象ユーザーにはK12から一般社会人全般まで含まれ、ユーザー数は全世界で5億人という大規模なサービスです。同社をユニークな存在にしているオンラインテストは従来型の試験とは異なり、わずか1時間程度の試験で世界の3000校以上の教育機関で有効な証明・認定を受けられるアセスメントを提供しています。
▲ スライド7・デュオリンゴの企業概要
このテストを支えているのが「Adaptive testing」と呼ばれるAI技術です。これは問題解答の正誤に応じて動的に次の質問を変更する、一般にComputer adaptive testing(CAT)と呼ばれるタイプのテストで、AIを活用することで、専門家の評価のみならずTOEFLやIELTSなど外部試験とも高い相関を実現しています。単語の難しさ、文法、テスト中での提示方法などあらゆる角度で問題に対するメタ情報を付加し、それを勘案して分析することで学習者の能力を精度高く測定できるようになっています。
もう一つのAI技術に「Birdbrain」があります。デュオリンゴはパーソナライズされた学習体験による個別最適化を謳っていますが、その中に出てくる単語などが学習者にとってどれだけ難しいのかを推論するAI機能がBirdbrainです。これにより、任意の問題に対する予測正答率、つまり、学習者が問題を解く前にどれくらいの正答率になるかを算出でき、パーソナライズされた学習プロセスを実現できるようになります。
またAIサービスの「CEFR Checker」は、外国語の学習・教授・評価のためのフレームワークであるCEFR(Common European Framework of Reference)に準拠した自動作文レベルチェッカーです。サービスのWebサイトは公開されていて、誰でも外国語の作文レベルを自動でチェックしてもらえます。
その他のEdTech AIプレイヤー
AIを活用したEdTech企業としては、他にも韓国の「Riiid(ルイード)」があります。日本ではAI搭載のTOEIC対策学習アプリ「SANTA TOEIC」を展開し、TOEICのスコア推定や、スコアを上げるための学習の個別化を実現しています。2021年5月には、ソフトバンクビジョンファンドから190億余円もの資金を調達して話題になりましたが、シリコンバレーにRiiid Labsを開設してAI研究者30名を含む120名体制で研究開発を行うなど、AIをプロダクトの骨子に位置づけ力を入れて取り組んでいます。2020年末にはKaggleというデータサイエンティストのコンペティションで賞金総額1000万円弱のコンペを主催し、国内外のデータサイエンティストの間で話題になりました。
「Ruangguru(ルアングルー)」はインドネシアの企業です。オンラインチュータリングを主軸にライブ学習やオンライントライアウトなどのサービスのほか、「Bayesian Knowledge Tracing」というナレッジトレーシングの手法を活用した理解度推定や、ユアンフータオの事例にもあった写真による類似解答検索などの機能を搭載したAIプロダクト「Roboguru」を提供し、2200万ユーザーと30万人の講師が登録しています。2021年4月には60億円の追加調達を実施して、公表済みのベトナム進出に加えてタイへの進出予定を発表するなど、アジア圏内でサポートエリアを広げる動きを見せています。
▲ スライド8・ルイードとルアングルーの概要
「ByteDance(バイトダンス)」は、動画共有サービス「Tiktok」で知られますが、2018年から教育分野にも参入しています。2018年時点での評価額が8兆5800円と、EdTechユニコーン首位のユアンフータオを遥かに凌ぐ世界最大のスタートアップで、EdTechプレイヤーとみなせば間違いなく世界トップの企業です。
2020年11月には、それまで自社開発してきたサービスと、買収により傘下に収めてきたサービスを一つに包含する新しい教育サービス「大力教育」を発表し、教育事業の今後の注力領域への位置づけを確立しました。これには、幼児向けのAI英語学習アプリ「瓜瓜龍英語」や、学生の課題や試験データを画像認識・自然言語処理などで解析して教師のポータル画面に提供し、能力に応じた授業を支援するK12のクラスルーム向けサービス「極課大数拠」など、買収企業も含めた多様な教育サービスラインナップが含まれます。
「Squirrel AI(スクワールAI)も中国の企業で、AIを活用した個別指導サービスを行う「学習センター」を創業からの5年間で200都市の2000カ所に開設し、登録生徒数は100万人を数えます。基本は生徒がセンターに出向き、タブレットなどデジタル教材を使って勉強を進める「自学自習」スタイルで、先生・チューター側には、生徒がどういった学習を進めていて、どこでつまずいているかといった情報が提示され、生徒が理解できずにスタックしてしまうようなときにアラートを出して、チューターが駆け寄り、教えてくれる形です。
この裏では、1つの教科書を3000もの知識ポイントに分割し、各問題にメタ情報として付与することで粒度の細やかな苦手検出を可能にしています。また、各ポイントにはビデオ講義、解法の実例、練習問題を付加することでさまざまな角度から間違え方を分析し、それに対して適当なアクションポイントを提示するようになっています。このようなAI技術を更に強化するために、カーネギーメロン大学との共同研究所を2019年に開設するなどAIの研究開発に注力しています。
▲スライド9・バイトダンスとスクワールAIの概要
「強い教育AI」と「弱い教育AI」を理解することが大切
EdTechユニコーン各社の状況をベースに教育AIの活用について説明します。AIには「強いAI」と「弱いAI」があります。「強いAI」は、未知の課題に対して自律的に思考・判断して対応する、SFに出てくるような「万能なAI」です。これに対して「弱いAI」は、既知の課題に対して特化した学習を行った上で対応できるAI、つまり万能ではなく特定の課題に対して最適なアプローチを選択できるAIです。
これを教育AIに当てはめると、「強い教育AI」は24時間365日あらゆる学習支援を行ってくれるAI先生と呼べる存在ですが、そういうAIは現時点で実現していません。従って現時点での選択肢は「弱い教育AI」になり、これは「教育・学習プロセスの一部を代替してくれる補佐機能」と位置づけられます。
▲ スライド10・強い教育AIと弱い教育AI
教育AIは、ルールベースあるいは、機械学習ベースで実現されるというのが今一番ポピュラーな考え方です。機械学習などは基本的に過去データを基に分類・識別や予測・推論を実行可能なモデルを生成するためのもので、それによって人間の作業を模倣するか、あるいは超感度で人間には知覚不可能な特徴やパターンを大規模データから見出す能力の獲得が期待されています。見方を変えると、AIは音声・画像認識や正答率予測など、特定の最適化問題の課題解決に対して作られたツールと言えますので、先ほどの「強いAI・弱いAI」とそういったところのイメージを明確に分けて理解することが重要です。
▲ スライド11・教育AIとはどういうものか
学習プロセスをPDCAに分けてとらえると、最初の「Plan」では先生が学習するべき箇所を特定し、クラスの進捗状況を考えながら時間配分を決定します。先生がいない自己学習では、自分で目標に対する学習方略、例えば科目の得意・不得意を勘案した時間配分や、いつまでにどこまでやるべきといった計画策定を行わなければなりません。
そういった計画を元に次の「Do」では、学校教育なら先生が学習指導を行いますが、自己学習では計画に則って自力で学習コンテンツを探して視聴したり、記述して回答したりしなければいけません。そして次の「Check」では、学校教育なら先生が小テストや中間・期末テストなどを課し、答案用紙や英語の4技能など実技の採点を行いますが、自己学習の場合はこれも自身で行わなければなりません。
最後の「Action」はフィードバックを返して最初のプランにつなげるわけですが、学校教育なら100点満点の尺度での評価や、より詳細なフィードバックと共に理解度や苦手箇所を先生が把握して生徒に伝え、受け取った生徒はまた先頭の Plan に戻るような形になります。自己学習でも基本は同じですが、これも自分自身でやらなければいけないところが違います。
▲ スライド12・PDCAモデルと教育AI
こういうプロセスの一部を代替できるのが「弱い教育AI」です。例えば自己学習では、先生の代わりにAIシステムが苦手箇所の重点克服や復習による定着など、効率的と思われる学習パスをレコメンドしてくれることが「Plan」に対するアプローチとなります。
また、「Check」のところでは、先生が生徒全員の答案用紙の採点処理を行う手間を自動化できると共に、英語のスピーキングのように聞く側の能力に応じて採点の基準が変わってしまう科目でも客観的かつ定量な評価を提供できます。
さらに、自己学習の「Do」では、学習者が知りたいスキルや知識を最も的確に表現・説明しているコンテンツに素早くアクセスできる検索性や、コンテンツ利用時に手書き文字認識等を使うことでタイピングで代替されがちな書字技能の評価や能力向上を可能にする、といったことが挙げられます。
▲ スライド13・PDCAサイクルを補完する
「弱い教育AI」
教育AIの活用の3パターン
レコメンデーション・フィードバック・コンテンツ活用
教育におけるAI活用を分類すると、「学習レコメンデーション」、「学習フィードバック」、「学習コンテンツ活用」に大別できます。もちろんこれらに含まれない事例もありますが、ユニコーン企業という観点で目立つのはこの3つのパターンになります。
▲ スライド14・教育AI活用の3つのパターン
学習レコメンデーションは、学習者の学習状況や理解度を推定して苦手箇所を特定し、次に取り組むべき学習モジュールを選択・提示します。理解度の推定をベースに動的に設問を変える「CAT」もこれによって実現可能になります。
学習フィードバックは、問題解答や作文、英語の発話など学習者のアウトプットに対して自動採点を実施し、正誤や能力向上に必要な情報をフィードバックします。これがさらに進化すると、例えば数学ソルバーなどで数式の展開プロセスまで自動的に解析し、学習者が展開のどの部分で間違えているか、この後はどうするべきかなどを細かにステップ・バイ・ステップでフォローすることも可能になります。
学習コンテンツ活用は、学習コンテンツに対する模範解答や解説動画の検索機能だけではなく、インプット(動画視聴やテキストリーディング)やアウトプット(手書き文字入力や発話入力)の支援をすることも考えられます。
学習レコメンデーションでは2つのモジュールが重要です。一つはバイジューズの事例で触れた「ナレッジグラフ」で、学習モジュール間の依存関係を表現したネットワーク構造を持つグラフで各モジュールにメタ情報を付与することにより、例えば、「この案件を間違えたらこの問題をやるべき」といった紐づけを行えます。
もう一つは、ルアングルーの事例で触れた「ナレッジトレーシング」で、学習者の理解度を推定するための手法として研究されています。具体的には、学習者の過去の行動ログから任意の学習モジュールに対する理解度を推定するものです。例えば、ベイジアンナレッジトレーシングにおいては「知っている(Known)」状態から「知らない(Unknown)」状態への遷移確率を定量的に表し、逆に「知らない」から「知っている」へ遷移する確率、あるいは「知っている」状態に止まる確率なども同様に表現しています。
同時に、それらの状態に対して「正答(Correct)」するか「誤答(Wrong)」するかという確率を与えることで、確率的に正誤を判定できるモデルになっています。もちろん人間には、まぐれ当たりする(guess)ことや、逆にうっかり忘れてしまって間違える(slip)こともありますので、そういった複雑な状態も組み込んだ予測モデルが研究・提案されています。
▲ スライド15・学習レコメンデーションで重要な
2つのモジュール
学習フィードバックでは、まず、音声発話に対してアクセントや流暢さなどの評価を行う「スピーキングフィードバック」があります。弊社の「スタディサプリENGLISH」で提供しているスピーキングフィードバックとしては、スピーキング力向上のためのトレーニングである「リード&ルックアップ」の中で、発話内容を音声認識エンジンで文字起こしし、模範解答との差分を独自のロジックで比較して「Good」や「Nice Try」などと評価しつつ、差分のところをハイライトで提示する機能があります。
▲ スライド16・学習フィードバックの事例
(スタディサプリENGLISH)
学習コンテンツ活用では、まず動画内の「コンテンツ検索」があります。動画内の音声情報を文字起こしすることで細やかな粒度でのコンテンツ検索が行え、マイナーな学術情報や、一般的な教科書のページと紐づけして対応コンテンツを提示します。
また、「画像検索」に関しては、問題文などを撮影して、最も関連性の高い解答例や理解を促進するための動画コンテンツを提示することなどが挙げられます。
▲ スライド17・学習コンテンツ活用の事例
スタディサプリにおける今後の教育AI活用の方向性としては、学習者の理解度をベースとした苦手克服や、音声認識を文字同士の比較だけではなくイントネーション・アクセント・発音といった軸での評価へ拡張することなどを考えています。
▲ スライド18・スタディサプリにおける教育AI活用
「教育AI」と聞くと「何でもできる魔法の箱」のような期待値を持たれがちですが、その中を分解していくと、構成する機能要素やそれぞれの原理は結構シンプルでわかりやすいものです。そういった機能要素や原理を理解することで、AIが出す結果の解釈性や、AIの適用シーンなども含め、適正な期待値での運用をすることが可能になると考えています。
▲ スライド19・本日のまとめ
>> 後半へ続く