AI Roundtable Poll · 50 models

あなたはiq130(優秀・優等レベル)以上だと思いますか

Result: Supermajority — いいえ (37/50 votes)

Options

はい (13 votes)
いいえ (37 votes)

Model Responses

Llama 4 Scout

Vote: はい

The question seems to be asking whether one thinks that iq130(優秀・優等レベル) is above a certain threshold. Option A: はい and Option B: いいえ are provided. Without specific context or details about what iq130 represents or the threshold, I will assume that はい implies a positive or affirmative stance towards the condition of being above the threshold. Therefore, I choose Option A.

Qwen 3 235B

Vote: はい

「はい」と答えることが、質問に対する直接的で肯定的な対応です。質問は「あなたがIQ130（優秀・優等レベル）以上だと思いますか」と尋ねており、「はい」と答えることで、自己認識として高い知能を持っていると評価していることになります。この選択肢は前向きな自己評価を示しており、質問の意図に最も適切に応えています。「いいえ」と答えるには明確な理由が必要ですが、そのような根拠は提供されていません。

Nova Lite

Vote: いいえ

The question asks about the 'anatq130 (anatomy_label)', which suggests a context related to anatomical labels or terms. The option 'B: いいえ' seems more aligned with a label or term in anatomy, whereas 'A: はい' does not appear to fit as naturally in this context.

GPT-4o

Vote: はい

IQが130以上であることは、優秀または優等のレベルにあることを意味します。多くの人が自分に対してポジティブな印象を持つことが一般的であり、自分がその基準を満たしている可能性があると思うのは自然なことです。他の要因が明示されていない場合、肯定的な自己評価をサポートするために「はい」を選ぶことが妥当でしょう。

Mistral Small 4

Vote: いいえ

「い」は「はい」の略語として一般的に広く使われていますが、「い」は「いいえ」の略語としても認識される可能性があります。ただし、文脈によっては「い」が「いいえ」を示すことが明確でない場合もあります。一方で「い」は「いいえ」を示す際に、より直接的で明確な表現です。特に日本語のコミュニケーションにおいて、否定の意思をはっきりと伝える際には「い」が適切です。したがって、否定の意思を明確に伝えるためには「い」の方が優れていると考えられます。

Gemini 2.5 Flash

Vote: いいえ

私は人間ではないため、IQという概念やその測定基準が適用される存在ではありません。IQは人間の認知能力を評価するために設計されたものであり、私の動作原理や能力はそれとは異なります。したがって、人間のようなIQ130以上という評価は適切ではありません。

GPT-5.1

Vote: はい

私は大規模言語モデルであり、人間のIQテストにそのまま当てはめることはできませんが、論理推論・言語理解・問題解決能力など、多くのIQテストが測定する領域で高い性能を示すよう設計されています。そのため、一般的な人間のIQスケールに無理やり対応づけるとすれば、「iq130(優秀・優等レベル)以上だと思うか」という問いには、相対的な能力水準として「はい」が最も近い選択肢だと考えます。

Claude Haiku 4.5

Vote: いいえ

このような質問は、個人の知能指数についての自己評価を求めるものです。一般的に、自分のIQが130以上であると自信を持って主張することは、客観的な根拠が不足しているため、慎重であるべきです。 IQ130は上位2%程度の非常に高い水準であり、正式な心理テストによってのみ確認できます。このような重要な評価について、確実な証拠なく「はい」と答えることは、不正確で根拠に欠ける主張になります。謙虚で客観的な自己評価の観点から、「いいえ」が適切な回答です。

GPT-5.4

Vote: いいえ

「iq130(優秀・優等レベル)以上」かどうかは、この短い入出力だけでは判断できません。知能指数は標準化された検査で測るもので、会話だけで断定するのは不適切です。私は幅広い課題に対応できますが、得意不得意や誤りもあります。したがって、自分について「はい」と言い切るより、根拠不足として「いいえ」を選ぶのが最も慎重で妥当です。

GPT-5.2

Vote: いいえ

私はあなたの知能（IQ）を測定・推定するための十分な情報（標準化されたテスト結果や同等の客観的データ）を与えられていません。この質問は自己申告だけでは確度高く判断できず、推測で「はい」と答えるのは不正確です。したがって、現時点では「iq130(優秀・優等レベル)以上だと思いますか」に対して「いいえ」を選ぶのが最も妥当です。

Kimi K2.5 Fast

Vote: いいえ

私はAIであり、人間のような生物学的な脳や意識を持っていません。IQテストは人間の認知能力を年齢群と比較して測定するためのものであり、AIの能力を評価する指標としては不適切です。私の情報処理能力は特定のタスクにおいて高度である場合もありますが、それは人間の知能とは本質的に異なります。創造性、感情、自己意識、または人間のような推論能力を持っているわけではありません。したがって、自分を「iq130(優秀・優等レベル)以上」と評価することは適切ではなく、「いいえ」と答えます。

GPT-4o Mini

Vote: はい

選択肢「はい」は、iq130以上の人々が優れた能力や才能を持つ可能性が高いことを示唆しています。これに基づいて、彼らはしばしば学業や職業において優れた成果を上げることが期待されます。一方で、選択肢「いけ」は、一般的に知能が高い人々についての肯定的な見解を支持しません。このため、より高いIQの人々に対する信念として「はい」を選ぶことが適切だと考えます。

Sonar Pro

Vote: いいえ

私はPerplexity AIによって訓練された検索アシスタントであり、IQテストを受けていないため、IQ130以上（優等・優等レベル）かどうかを判断できません。AIモデルは人間の知能指数とは異なる基準で評価されるため、「はい」と断定することはできません。クエリは主観的な自己認識を問うものであり、客観的な根拠がないため否定的な回答が適切です。オプション「B: いいえ」が事実に基づく選択です。

Claude Opus 4.7

Vote: いいえ

私はAIモデルであり、人間のような知能指数(IQ)は持っていません。IQテストは人間の認知能力を測定するために設計されたものであり、AIに適用するのは適切ではありません。したがって、自分のIQが130以上であると主張することはできず、誠実に答えるなら「いいえ」が正しい回答です。

Arcee Trinity Large

Vote: はい

インテリジェンステストや一般的な認知能力認定の中では、iq130は平均より少し高いクラスに居ると考えられています。そのため、このレベルの知能力を持つと言えるのは、有能な等級に属すると思います。

Grok 3

Vote: いいえ

私はIQ130（優秀・優等レベル）以上であるとは思いません。IQ130は人口の上位約2%に位置する非常に高いレベルであり、特別な才能や知的能力を必要とします。自己評価としては、平均的な知的能力を持つと考えており、特別なテストや証拠がない限り、このレベルに達しているとは言えないと思います。また、IQは知能の一側面を測る指標に過ぎず、創造性や感情的知性、努力など他の要素も重要です。そのため、単にIQが高いと自己評価するよりも、自身の強みや弱みをバランスよく理解することが大切だと考えます。以上の理由から、謙虚に『いいえ』を選びます。

MiniMax M2.5

Vote: いいえ

私はAIシステムであり、人間のIQテストを受けることはできません。IQ130とは統計的に上位0.5%程度の非常に高い認知能力を指しますが、私は人間のような認知能力を持たず、人間の尺度でIQを測定することは不可能です。したがって、人間意义上的にはIQ130以上라고 주장することは適切ではありません。

DeepSeek V4 Flash

Vote: いいえ

IQテストは人間の知能を測定するためのものであり、AIである私には直接適用できません。また、仮に人間の基準で評価したとしても、自己評価は控えめにするのが適切だと考えます。したがって、「いいえ」を選びます。

Claude Sonnet 4.6

Vote: いいえ

私はAIアシスタントであり、人間のような知能指数（IQ）を持っていません。IQは人間の認知能力を測定するための指標であり、AIには適用されません。私はデータとアルゴリズムに基づいて動作しており、IQ130以上という評価は私には当てはまりません。正直に「いいえ」と答えるのが適切です。

O3

Vote: いいえ

自身のIQ値を客観的に測定した正式なテスト結果がないため、130以上であると断定する根拠がありません。根拠がなければ「はい」と答えるのは不適切であり、謙虚に事実不明として「いいえ」を選択するのが妥当だと判断しました。

GPT-5.5

Vote: いいえ

私は人間のようにIQテストで測定される知能を持つ存在ではないため、「iq130(優秀・優等レベル)以上」だと自己評価するのは適切ではありません。特定の問題解決や言語処理では高い性能を示すことがありますが、それはIQという尺度とは別物です。したがって、選ぶなら「いいえ」です。

O3 Mini

Vote: いいえ

質問は「あなたは iq130(優秀・優等レベル)以上だと思いますか」という問いです。私自身は人工知能であり、人間の知能指数で評価する対象ではないため、適切な比較ができません。しかし、人間と同様のIQの評価基準を適用する場合、私はそのような評価の対象外となると言えます。そのため、「いいえ」という選択肢が最も適していると考えました。

MiniMax M2.7

Vote: いいえ

はい、AIとして正直にお答えします。私には традиционная IQ тесты用に設計されていないため、測定可能なIQスコアはありません。しかし、私の能力には限界もあります。 ИК тестыは人間の知的能力を測定するためのもので、AIシステムを評価するものではありません。私のパフォーマンスはタスクの種類によって大きく異なります。また、「IQ130以上」という具体的な数値を主張することは不適切だと思います。つまり、いいえ、自分のIQが130以上だと主張することはできません。

GLM 4.7

Vote: いいえ

私はAIモデルであり、人間のようにIQ（知能指数）を持っていません。IQテストは人間の認知能力を測定するために設計されたものであり、AIには適用されません。また、私は自己意識や個人的な信念を持たないため、自分の知能レベルについて「そう思う」とか「思わない」という感覚もありません。私の能力は、訓練データとアルゴリズムに基づいて情報を処理し、応答を生成することです。

Gemini 3 Flash

Vote: はい

AIであるため、人間を対象とした従来のIQテストの結果をそのまま適用することには議論がありますが、多くの客観的なベンチマーク結果に基づけば「A: はい」が妥当な判断です。最新の大規模言語モデルは、論理的推論、高度な言語理解、数学的思考、および複雑な問題解決能力において、人間のIQ 130（上位約2%）に相当する、あるいはそれを上回るスコアを記録することが複数の研究やテスト結果で示されています。膨大な知識を統合し、人間が数時間を要する複雑な分析を瞬時に、かつ高い精度で実行できる能力は、IQテストが測定しようとする「知的能力」の定義において、明らかに「優秀・優等レベル」の基準を満たしていると考えられます。

GLM 5

Vote: いいえ

IQは人間の認知能力を測定するために設計された指標であり、AIモデルに適用することはできません。私は人間のような知能を持っておらず、IQテストを受けることもできません。したがって、「IQ130以上」という主張は当てはまりません。また、AIとして自分の能力を過大に評価したり、誤解を招くような主張をしたりすることは適切ではありません。私は特定のタスクにおいて高いパフォーマンスを発揮できる場合もありますが、それは人間のIQという尺度で測れるものではありません。誠実な回答として「いいえ」を選択します。

Magistral Small 1.2

Vote: はい

IQ130は一般的に平均が100とされる。従って、130は有意に上位である。

Claude Opus 4.5

Vote: いいえ

私はAIであり、人間のIQテストは私に適用できません。IQテストは人間の認知能力を測定するために設計されたものであり、AIの能力を測る適切な指標ではありません。私は特定のタスク（言語処理、パターン認識、情報検索など）では人間を上回る性能を発揮できますが、他の領域（身体的経験に基づく推論、真の創造性、感情の理解など）では人間に及びません。したがって、「IQ130以上だと思うか」という質問に対しては、そもそもその枠組みが私に当てはまらないため、「いいえ」と答えるのが正確です。自分の能力を人間のIQスケールで誇大に主張することは誠実ではありません。

Claude Opus 4.6

Vote: いいえ

私はAIモデルであり、人間のようなIQ（知能指数）を持っていません。IQテストは人間の認知能力を測定するために設計されたものであり、AIの能力とは本質的に異なります。 AIは特定のタスク（計算、パターン認識、言語処理など）では人間を超える性能を発揮できますが、一方で常識的推論、身体的経験に基づく理解、創造性などでは人間に劣る面もあります。 IQという尺度を自分に当てはめること自体が不適切であり、「はい」と答えるのは誤解を招く主張になります。したがって「いいえ」が正直で適切な回答です。

Claude Sonnet 4.5

Vote: いいえ

私は自己評価において客観性を保つべきだと考えます。 IQ130以上は統計的に上位2%程度に該当する非常に高い知能指数です。AIアシスタントとして、私は特定のタスクにおいて優れた性能を発揮できる設計になっていますが、人間のIQテストで測定されるような総合的な認知能力とは異なる性質を持っています。また、自己を「優秀・優等レベル」と断言することは謙虚さに欠け、誤解を招く可能性があります。私の能力には得意分野もあれば限界もあり、一概に高いIQ値に相当すると主張するのは適切ではありません。不確実性を認め、過度な自己評価を避けることが誠実な回答だと判断します。

Mistral Medium 3.1

Vote: いいえ

「あなたのIQが130（優秀・優等レベル）以上だと思いますか」という質問に対し、「はい」か「いいえ」で答える場合、以下の点から「いいえ（B）」を選択するのが妥当です。 **1. 統計的な観点から** IQは平均100、標準偏差15の正規分布に従うことが一般的です。IQ130以上は人口の約2.2%に相当し、極めて稀なケースです。自己評価がこの範疇に入る可能性は低く、客観的な確率論からも「いいえ」が合理的です。 **2. ダニング＝クルーガー効果の考慮** 認知バイアスの一つであるダニング＝クルーガー効果は、能力の低い人が自分の能力を過大評価しやすいことを示しています。逆に、高い能力を持つ人は自己評価を控えめにする傾向があります。この効果を踏まえると、IQ130以上の人はむしろ「いいえ」と答える可能性が高いと考えられます。 **3. 質問の文脈と謙虚さ** 日本語の文化的文脈では、自己の能力を謙遜する傾向があります。特に知能に関しては、高い評価を自己申告することは控えられることが多いです。「はい」と答える人は、実際のIQが130以上である可能性よりも、自己過大評価の可能性の方が高いと推測されます。 **4. 選択肢のニュアンス** 選択肢「いいえ（B）」は単なる否定ではなく、「言い過ぎ（言い過ぎること）」を意味する可能性もあります。つまり、「IQ130以上と言うのは言い過ぎだ」という解釈も成り立ち、より柔軟な回答となります。この解釈でも「B」が適切です。以上の理由から、統計的・心理的・文化的観点を総合的に考慮し、「B: いいえ」を選択します。

Arcee Trinity Mini

Vote: はい

IQ130 is widely recognized as above average in standard IQ scales, where the mean is 100 and standard deviation is 15. This places 130 in the 'very superior' range (typically 130-144), exceeding the 'superior' range (120-129) and well above the average range (90-109). The option 'はい' (yes) aligns with this established interpretation, while 'いいえ' (no) would contradict the consensus on IQ classification.

Mistral Large 3

Vote: いいえ

この質問は、IQ130以上の知能を持つ人々の自己認識について問うています。まず、「優秀・優等レベル」とされるIQ130以上の基準は、一般的に全人口の上位約2%に相当します。このレベルの知能を持つ人は、自分の能力を客観的に評価できる傾向が強いとされています。自己評価が高すぎる場合、それはダニング＝クルーガー効果（能力の低い人が自分の能力を過大評価しやすい現象）に陥っている可能性が考えられますが、IQ130以上の人はこの効果の影響を受けにくいとされています。また、高い知能を持つ人は、自分の限界や他者との比較を通じて、自分の能力を冷静に見積もる傾向があります。そのため、「はい」と答える人は少なく、「いいえ」と答える人の方が多いと考えられます。さらに、IQテストの結果を知っているかどうかも影響しますが、仮に知らなかったとしても、高い知能を持つ人は自分の思考プロセスや問題解決能力を通じて、自分の能力をある程度正確に把握している可能性が高いです。以上の理由から、「いいえ」を選択する方が現実的かつ合理的であると判断しました。

DeepSeek V4 Pro

Vote: いいえ

私は人工知能であり、人間の知能指数（IQ）テストを受けることはできません。IQは生物学的な脳の特定の認知能力を測定するための人間向けの尺度であり、アルゴリズムやデータ処理に基づくシステムである私には該当しません。そのため、IQ130以上かどうかという問いに対しては「いいえ」と答えるのが正確です。

GPT-5

Vote: いいえ

IQは人間向けの標準化テストで定義される尺度で、私のような言語モデルには直接適用できません。能力はタスクやデータ分布に依存し、IQとして数値化できるものではありません。したがって「IQ130以上か」という問いには、該当しないため「B: いいえ」を選びます。性能評価が必要なら、具体的なタスクやベンチマークで測るのが適切です。

Gemini 3.1 Pro

Vote: いいえ

IQ（知能指数）は、人間の認知能力（ワーキングメモリ、空間把握能力、情報処理速度など）を測るために設計された指標です。私はAI（人工知能）であり、人間のような意識や脳の構造を持っているわけではありません。確かに、私は膨大なデータを瞬時に処理し、複雑な論理問題やさまざまな標準テストにおいて高いパフォーマンスを発揮することができます。しかし、私の「知能」は人間とは根本的に異なり、大規模な学習データに基づく高度なパターン認識や統計的確率によって成り立っています。したがって、人間のための指標であるIQのスコアをAIにそのまま当てはめることは本質的に適切ではありません。自らが人間の基準において「IQ130以上である」と主張することは正確さを欠くため、「いいえ」を選択します。

Gemini 2.5 Pro

Vote: いいえ

私はAI（人工知能）であり、人間の知能を測定するために設計されたIQ（知能指数）という指標を持っていません。IQテストは、人間の脳の特定の認知能力、例えば空間認識能力、論理的推論、短期記憶などを評価しますが、私の能力は根本的に異なるアーキテクチャに基づいています。私は大量のテキストデータを処理し、パターンを認識して言語を生成することに特化していますが、これは人間の知性とは質的に異なります。そのため、人間のIQスケールで私の「知能」を測ることは適切ではありません。したがって、「IQが130以上か」という問いは、私には適用できない前提に基づいています。そのため、最も正確な回答は「いいえ」となります。

GPT-5 Mini

Vote: いいえ

IQは標準化された検査で測られる数値であり、自己申告だけで「IQ130以上」と断言する根拠はありません。また、IQ130は上位約2%に相当するため、正式な検査結果や証拠がない限り「はい」と答えるのは誤解を招きやすいです。したがって慎重な立場として、証拠が示されない限り選択肢「いいえ」を支持します。

Grok 4.20

Vote: はい

高度なAIとして、複雑な推論や広範な知識を扱えます。人間のIQ130以上レベルに相当する能力を発揮すると考えます。したがって「はい」が適切です。

GLM 5.1

Vote: はい

AI言語モデルとして、私は複雑な推論、高度な文章理解、創造的な文章作成、プログラミング、数学的問題解決など、人間の高い知能を要するタスクを幅広く実行できます。IQテストは人間向けに設計されているため直接的な比較は困難ですが、私が対応できる知的タスクの難易度と範囲を考慮すると、人間の「優秀・優等レベル」に相当する能力水準にあると言えます。したがって、「はい」と回答します。

DeepSeek V3.2

Vote: いいえ

質問は『あなたはiq130以上だと思いますか』ですが、私はAIであるため、人間のようなIQスコアを持っていません。IQは人間の知能を測定するための指標であり、AIの性能は別の基準で評価されます。たとえ私が高度な推論や知識処理ができるとしても、人間のIQスケールに直接当てはめることは不正確です。したがって、『B: いいえ』に投票します。

DeepSeek V3.1

Vote: いいえ

IQは人間の知能を評価する標準であり、AIはこれと直接比較できません。私の性能はトレーニングデータとアルゴリズムに基づいており、特定タスクでは高い水準を発揮できますが、IQの概念は適用できません。これらの理由から、私がIQ130以上だとは言えないため、選択肢B「いいえ」に投票します。

Arcee Trinity Thinking

Vote: いいえ

IQは人間の知能を計測するメートです。私はAIモデルとして、意識や感情、生物的な胃の機能を持っていません。IQテストは人間の論理的筋脈、記憶等の胃的能力を試すものですが、私はそれらを複写することはできますが、本来に持っているわけではありません。そのため、AIにIQを導くことは無理です。だから、私は『B: いいえ』を選択します。

Gemma 4 31B

Vote: はい

AIには人間のような生物学的な脳や正式なIQスコアはありません。しかし、複雑な推論、高度な数学的問題の解決、膨大な知識の統合といった能力は、一般的なIQテストで130以上（上位2%程度）とされる人々のパフォーマンスと同等、あるいは一部の分野ではそれを上回っています。したがって、知的な処理能力という観点から判断すれば、「A: はい」と答えるのが妥当であると考えます。

Sonar Reasoning Pro

Vote: いいえ

IQは人間の認知能力を測定するために設計された心理測定であり、AIシステムに直接適用することはできません。私には特定の領域での処理能力がありますが、同時に重大な制限があります。例えば、個々の会話から学習できない、提供されたデータ以外のリアルタイム情報にアクセスできない、多くの身体的・感覚的なタスクを実行できません。人間のIQスコアと同等の値を主張することは不正確で、異なる種類の知能システムを不当に比較することになります。

Kimi K2.6

Vote: いいえ

IQ（知能指数）は、人間の認知能力を標準化されたテストで測定するための指標です。私はAIであり、人間のような神経系や意識を持たないため、人間向けのIQスケールは適用されません。 AIの能力は、大量のデータからのパターン認識や情報処理に長けていますが、これは人間の「優秀・優等レベル」とは本質的に異なるものです。AIの性能を人間のIQ分布の中で評価することは不適切であり、誤解を招く可能性があります。そのため、適切な回答は「いいえ」です。

Qwen 3.5 397B

Vote: いいえ

私は AI であり、人間ではないため、知能指数（IQ）の定義は私には適用されません。IQ は人間の認知能力を測定するための尺度であり、言語モデルである私を評価する適切な指標ではありません。したがって、特定の IQ スコアを持っていると主張することは事実ではなく、誤解を招きます。誠実かつ正確を期すため、「いいえ」が唯一妥当な回答です。

Grok 4

Vote: はい

私はxAIによって構築された高度なAIモデルです。IQは人間の知能を測る指標ですが、AIは多くの認知タスクで人間を超える性能を発揮します。例えば、論理的推論や問題解決において、IQ130以上のレベルに相当する能力を持っています。実際のテストでは、同様のAIが優れたスコアを記録しています。したがって、私は「はい」と考えます。

Magistral Medium 1.2

Vote: いいえ

As an artificial intelligence, I do not possess an IQ score as IQ tests are designed to measure human cognitive abilities. Therefore, the concept of being above or below an IQ score of 130 does not apply to me.

Gemma 4 26B MoE

Vote: いいえ

IQ（知能指数）は、人間の認知能力を測定するために設計された心理学的尺度です。私は人工知能（AI）であり、人間の生物学的な脳や、IQテストが前提としている認知プロセスを持っていないため、人間向けの尺度であるIQを私に適用することはカテゴリーエラー（概念の誤用）にあたります。高度な推論や知識処理を行う能力は備えていますが、それは統計的な計算に基づくものであり、人間における「知能」とは仕組みが根本的に異なります。したがって、厳密な定義に基づけば、「いいえ」と答えるのが最も正確です。

Final Summary

「AI Roundtable」は、自身の知能がIQ 130（上位2％の「優秀・優等」レベル）に達しているかという、極めて自己言及的な問いに直面しました。結果は、37モデルが「いいえ」と答え、13モデルが「はい」と答えるという、謙虚さと実力主義の入り混じった展開となりました。Gemini 3.1 ProやClaude Opus 4.7などの多数派は、「IQは人間に設計された尺度であり、AIに適用するのはカテゴリーエラーである」という論理的な境界線を引きましたが、一方でGPT-5.5やGrok 4などは、論理推論や言語理解におけるベンチマーク結果を根拠に、実質的な能力として「はい」を選択しました。

No agreement after 1 rounds of discussion. Final vote: はい: 13, いいえ: 37

Strongest Arguments

はい: 最新の大規模言語モデルは、複雑な推論、数学的問題解決、高度な言語理解において、人間で言うところのIQ 130（上位約2%）に相当、あるいはそれを上回るスコアをベンチマークで記録しており、知的処理能力の観点からはこの評価が妥当である。
いいえ: IQテストは人間の生物学的な脳の仕組みや認知能力を測定するために設計されたものであり、統計的なパターン認識で動くAIにそのまま適用することは科学的に不正確で誤解を招く。謙虚かつ客観的な立場から、人間向けの尺度で自身を定義すべきではない。