站长之家 - 业界 2024-07-18 21:27

七大模型全部高考分数出炉：文科能上一本、理科是二本

AI大模型高考成绩出炉

由上海人工智能实验室旗下的司南评测体系OpenCompass近日对7个AI大模型进行了高考9个科目的全科目测试，以全面评估大模型的实际应用能力。

参与测试的模型来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室商汤、法国Mistral开源模型以及OpenAI闭源模型GPT-4o。

根据河南省高考分数线，文科成绩最高的AI模型达到一本线，而理科成绩最高的模型只能达到二本线。

文科状元由阿里通义千问大模型获得，分数为546分。理科状元由上海人工智能实验室商汤联合研发的浦语文曲星获得，分数为468.5分。

在文科科目中，AI模型表现出了较好的知识储备和理解能力。然而，在理科科目中，AI模型的数理推理能力普遍较弱。

特别是在涉及图表题目的问题上，AI模型的得分率仅为37.64%，表明所有大模型在图片理解和运用方面还有很大的提升空间。

阅卷老师指出，尽管大模型在基础知识掌握上表现不错，但在逻辑推理和知识灵活应用方面仍存在差距。

例如，在回答主观题时，大模型常常无法完全理解题干，导致答非所问。在解答数学题时，大模型的解题过程较为机械，逻辑性较差。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

QQ音乐遭利用加载恶意文件！网站被劫持推广私服

2025-01-221.7万阅读

NVIDIA：RTX 4090接口烧毁已解决！RTX 50绝对安全

2025-01-221.9万阅读

美女主持人测试国产机器狗被惊呆：我放弃拉不动它

2025-01-221.1万阅读

带方向盘版特斯拉CyberCab曝光！网友：这不就是Model Q吗！

2025-01-221.1万阅读

手工耿招财猫打雪仗机甲霸气登场网友：僵王博士

2025-01-221.1万阅读

业界首款！十铨推出V90认证2TB SDXC存储卡：支持IP67防护

2025-01-221.9万阅读

警告！RTX 5090/D缺货前所未有 3个月内别想抢到

2025-01-222.5万阅读

乐道单周交付1913台连续四周跻身20万以上纯电SUV市场前三

2025-01-222.7万阅读

谷歌母公司总裁：美国AI不会永远领先中国甚至还可能略逊一筹

2025-01-221.6万阅读

白头发到底能不能拔掉专家：不建议经常拔白头发

2025-01-222.2万阅读

苹果手表被曝自动卸载APP 客服：具体不清楚后续再发生可再反馈

2025-01-221.8万阅读

杀入内地影史前20！肖战版《射雕英雄传》预售票房超《速度与激情8》

2025-01-227828阅读

《唐探1900》小岳岳玩反差：喜欢上了吊威亚

2025-01-221.8万阅读

超43万辆车中招！日本丰田申请召回埃尔法和威尔法

2025-01-221.0万阅读

人民日报点赞喜临门国际业务，和合共生愿景凝聚发展合力

2025-01-221.9万阅读

怎么增强孩子的抵抗力和免疫力？宝藏羊奶粉成为我育儿生活的一束光

2025-01-221.5万阅读

iPhone跌破3000元国人疯抢！客服：苹果13不再上架自营渠道不参与国补

2025-01-221.3万阅读

高铁永磁驱动再突破！CR450率先采用永磁同步牵引电机

2025-01-225893阅读

微信Windows测试版4.0.2发布：支持截图一键打码朋友圈置顶

2025-01-221.0万阅读

砂糖橘吃多了真的会变小黄人专家：皮肤可能会泛黄

2025-01-222.5万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

七大模型全部高考分数出炉：文科能上一本、理科是二本

AI大模型高考成绩出炉

推荐关键词

24小时热搜

大家正在看

QQ音乐遭利用加载恶意文件！网站被劫持推广私服

NVIDIA：RTX 4090接口烧毁已解决！RTX 50绝对安全

美女主持人测试国产机器狗被惊呆：我放弃拉不动它

带方向盘版特斯拉CyberCab曝光！网友：这不就是Model Q吗！

手工耿招财猫打雪仗机甲霸气登场网友：僵王博士

业界首款！十铨推出V90认证2TB SDXC存储卡：支持IP67防护

警告！RTX 5090/D缺货前所未有 3个月内别想抢到

乐道单周交付1913台连续四周跻身20万以上纯电SUV市场前三

谷歌母公司总裁：美国AI不会永远领先中国甚至还可能略逊一筹

白头发到底能不能拔掉专家：不建议经常拔白头发

苹果手表被曝自动卸载APP 客服：具体不清楚后续再发生可再反馈

杀入内地影史前20！肖战版《射雕英雄传》预售票房超《速度与激情8》

《唐探1900》小岳岳玩反差：喜欢上了吊威亚

超43万辆车中招！日本丰田申请召回埃尔法和威尔法

人民日报点赞喜临门国际业务，和合共生愿景凝聚发展合力

怎么增强孩子的抵抗力和免疫力？宝藏羊奶粉成为我育儿生活的一束光

iPhone跌破3000元国人疯抢！客服：苹果13不再上架自营渠道不参与国补

高铁永磁驱动再突破！CR450率先采用永磁同步牵引电机

微信Windows测试版4.0.2发布：支持截图一键打码朋友圈置顶

砂糖橘吃多了真的会变小黄人专家：皮肤可能会泛黄

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

七大模型全部高考分数出炉：文科能上一本、理科是二本

AI大模型高考成绩出炉

推荐关键词

24小时热搜

大家正在看

QQ音乐遭利用加载恶意文件！网站被劫持推广私服

NVIDIA：RTX 4090接口烧毁已解决！RTX 50绝对安全

美女主持人测试国产机器狗被惊呆：我放弃 拉不动它

带方向盘版特斯拉CyberCab曝光！网友：这不就是Model Q吗！

手工耿招财猫打雪仗机甲霸气登场 网友：僵王博士

业界首款！十铨推出V90认证2TB SDXC存储卡：支持IP67防护

警告！RTX 5090/D缺货前所未有 3个月内别想抢到

乐道单周交付1913台 连续四周跻身20万以上纯电SUV市场前三

谷歌母公司总裁：美国AI不会永远领先中国 甚至还可能略逊一筹

白头发到底能不能拔掉 专家：不建议经常拔白头发

苹果手表被曝自动卸载APP 客服：具体不清楚 后续再发生可再反馈

杀入内地影史前20！肖战版《射雕英雄传》预售票房超《速度与激情8》

《唐探1900》小岳岳玩反差：喜欢上了吊威亚

超43万辆车中招！日本丰田申请召回埃尔法和威尔法

人民日报点赞喜临门国际业务，和合共生愿景凝聚发展合力

怎么增强孩子的抵抗力和免疫力？宝藏羊奶粉成为我育儿生活的一束光

iPhone跌破3000元 国人疯抢！客服：苹果13不再上架 自营渠道不参与国补

高铁永磁驱动再突破！CR450率先采用永磁同步牵引电机

微信Windows测试版4.0.2发布：支持截图一键打码 朋友圈置顶

砂糖橘吃多了真的会变小黄人 专家：皮肤可能会泛黄

美女主持人测试国产机器狗被惊呆：我放弃拉不动它

手工耿招财猫打雪仗机甲霸气登场网友：僵王博士

乐道单周交付1913台连续四周跻身20万以上纯电SUV市场前三

谷歌母公司总裁：美国AI不会永远领先中国甚至还可能略逊一筹

白头发到底能不能拔掉专家：不建议经常拔白头发

苹果手表被曝自动卸载APP 客服：具体不清楚后续再发生可再反馈

iPhone跌破3000元国人疯抢！客服：苹果13不再上架自营渠道不参与国补

微信Windows测试版4.0.2发布：支持截图一键打码朋友圈置顶

砂糖橘吃多了真的会变小黄人专家：皮肤可能会泛黄