MathVistaとは

MathVistaとは、図や表を見ながら数学的に考えられるかを測るAIベンチマークです。LLMマルチモーダルAIが、文章だけでなく図形、グラフ、表、科学図を読んで答えを出せるかを見ます。社内資料でいえば、図表つきのレポートを読んで判断できるかに近い能力です。

文章問題だけでは見えない力

MathVistaの公式ページでは、31の異なるデータセットから集めた6,141例を含むと説明されています。算数の文章問題だけでなく、図形問題、関数グラフ、表、科学図などを扱う構成。AIが「文章は読めるが図の意味を取り違える」場合、このような評価で差が出るでしょう。導入判断では、自社の図表資料で同じ検証をする視点が重要です。

Topic答えを公開しないテストがある

MathVistaでは、お試し用の小さな問題セット(testmini)とは別に、本番の評価に使う問題セット(test)が用意され、公式ページではそちらの答えラベルを公開しないと説明されています。AIが過去問を覚えるほど、評価側も答えの管理が重要になるということです。

MathVistaに関するよくある質問

MathVistaは数学が得意なAIを探すための指標ですか?
数学力を見る指標のひとつですが、特徴は図や表を含むことです。文章だけの計算問題より、視覚情報を読んで考える力が問われます。
MathVistaの結果は業務資料の読解精度を保証しますか?
保証はしません。図表を読む力の参考にはなりますが、自社の帳票、グラフ、スライドでの検証は別に必要です。

あわせて読みたい記事