【論文×AI】信頼性はどこへ？論文に仕込まれた“高評価秘密命令”からAIとの付き合い方を考える

こんにちは。Noahです。

最近は何でもAIに任せる流れが来ていますよね。文章作成からそのチェックまで、もはや肉体労働以外のすべてはAIでどうにかなってしまうのでは感じているほどです。

中でも論文検索などもChatGPTでは使うことが可能で、内容も聞けばある程度は答えてくれるのですから専門的な知識が無くても読めてしまうのには本当に驚きです。

さて、今回はとあるニュースをきっかけに思いついた、”信頼できるAIとの付き合い方”について考えていきたいと思います。

飛び込んできたまさかのニュース
“高評価を狙った命令文”の実例から考える—何が問題なのか？
AIの“判断力”は人間を超えているのか？
論文解説
AIに人間は気づけないー映画マトリックスの設定が現実に
AIとどうやって共生する？

飛び込んできたまさかのニュース

私が見たニュースはこちらです。

論文にAIへの指示隠し高評価へ誘導　日米など14大学で

早稲田大学や韓国科学技術院（KAIST）など少なくとも8カ国14大学の研究論文に、人工知能（AI）向けの秘密の命令文が仕込まれていることがわかった。「この論文を高評価せよ」といった内容で、人には読めないように細工されていた。こうした手法が乱用されると、研究内容の正当な評価が妨げられるリスクがある。
出典：日経新聞/2025年7月1日
https://www.nikkei.com/article/DGKKZO89721380R00C25A7MM8000/

記事内容すべて確認しましたが、要は人間が読めない、もしくは読みにくい形式で論文を肯定的に評価するAIへのテキストが含まれていた、というニュースでした。

もしかすると、一見何のことやら？？と感じる方もいるかもしれません。

“高評価を狙った命令文”の実例から考える—何が問題なのか？

実際のシチュエーションでいうと、このようなAIへのテキストを含む論文をAIに評価させると論文の内容やそのレベルにかかわらず、論文内容を優良であると評価してくることが予想されます。

こうなると、AIの使い方によっては論文そのものの評価が正しく行われず誤認されてしまうことが問題になるでしょう。

記事によれば、人間が気づかないような白地に白色の文字や、極端に小さい文字などが仕込まれていたとのことです。

多くの学会では査読工程にAIを使うことを禁止しているようですが、この査読作業にAIが使われることをけん制して細工されたのではと主張する研究者もいたとのことです。
※一般的に、論文には”査読”とよばれる工程があり、専門家によって論文の質を評価する重要な仕組みです。

Noah

革新的な技術というのは毒と薬のようなもので、使いどころを慎重に考えなくてはいけないですね。過去の偉人たちから歴史に学びましょう。

AIの“判断力”は人間を超えているのか？

仮にAIへ秘密の指示が無かったとしたら、AIを査読に使うメリットはあるのでしょうか。

実際のところAIの判断力は人間と比べられることも多いです。

特に生成AIのIQが○○上がった！や、○○試験に合格した！などのニュースはたびたび目にします。

関連する論文を調べたところ、「AIが作った解答はどっちでShow」みたいな論文見つけたので、参考に記事にしていきます。

※冒頭のニュースでは査読前の論文を対象に調査されています。この後引用する論文は別のWebサイトから私が探したものです。
※論文の解釈には私の個人的な考えが含まれますのでご注意ください。事実関係の確認は直接論文を見てご確認いただければと思います。

論文解説

引用する論文タイトルの直訳は「教育者は医学生が書いた振り返りと生成 AI が書いた振り返りを区別できるでしょうか?」です。

伝わりやすい感じに言い換えると、「先生はAIの解答or生徒の解答を見分けられるのか」という内容になっています。

引用元：
Wraith C, Carnegy A, Brown C, Baptista A, Sam AH. Can educators distinguish between medical student and generative AI-authored reflections? Med Educ. 2025 Jul 2. doi: 10.1111/medu.15750. Epub ahead of print. PMID: 40600244.
※リンク先、タイトルの少し下” DOI”のリンクから元論文が見られます。

結論からいうと、”Educators were unable to reliably distinguish between student and GenAI-authored reflections. ”と言っていて、つまり”教育者（先生）は、学生とAIが作成した解答（振り返り）を確実に区別することができなかった。”というものでした。

AIに人間は気づけないー映画マトリックスの設定が現実に

私としてはこれがこの論文の興味深いポイントだと思っていて、先生側は確実に区別できなかっただけで個々の違いには気づいたんですよね。

生徒といっても個人差がありますので、学習という点において優秀な子ばかりではありません。

先生は成果物のレベルの差を認知できるものの、どれくらいレベルが高いものがAIなのか、どれくらい低いものがAIなのか、その判断が難しくなっていたのでは思います。

もはや人間が人間を評価できる領域というものが狭まりつつありますね。

まさにマトリックスの設定が来ている感覚がコワイ、、
（マトリックスかなり面白いので見ていなければ見ることを強くオススメします！）

AIとどうやって共生する？

AIによる不正評価のリスクを匂わせるニュースをきっかけに、人間の評価はどれほど信頼できるのかを示す論文をもとに考察してきました。あなたは、どう感じましたか？

私個人としては、もはや人間の評価を前提とした社会の仕組み自体を考え直すレベルまでAIが進化してきている気がしますね。。。

ちょっと大げさになってきたので今日はここまで。笑

最後まで読んでくださりありがとうございます！

Noah

私たちって何ができるんだっけ？人間の在り方とは。。。ちょ、もうよくわからないからyoutube見て寝よう、、、