首页 > 新车测评 > 新车测评 > 几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

发布时间:2025-09-26 16:24:11来源: 15210273549

随着多模态大语言模型(MLLMs)在视觉问答、图像描述等任务中的广泛应用,其推理能力尤其是数学几何问题的解决能力,逐渐成为研究热点。

然而,现有方法大多依赖模板生成图像 - 文本对,泛化能力有限,且视觉与文本信息之间存在严重不对齐问题,制约了模型在复杂几何推理任务上的表现。



来自 UIUC 的作者团队的研究提出了一种基于强化学习与可验证奖励 RLVR数据生成与优化框架 ——Geo-Image-Textualization,并发布了首个完全对齐的高质量几何图像 - 文本数据集 GeoReasoning-10K,包含 1 万对精心构建的图像与描述。

并且,为了促进社区发展,作者团队已公开 GeoReasoning-10K 数据集及相关代码。

新车测评更多>>

里程碑:AMD x86处理器总份额首度突破25% 1299元起!iPhone Pocket手机包正式开售 苹果:限量发售抢到就是赚 第17次双11大促,一次远场与近场的混战 球爆了!樊振东4-2逆转王楚钦,17板对拉炸场全运会 金鸡奖2025爆点,倪妮冲上主持台!明星阵容曝光、谁能夺大满贯? 00后女孩每月花五千买“秒回师”引热议:快节奏生活的新体现 泉州惠安第一民企迎来80后女总裁,身家260亿,曾为福建女首富 东风日产N6预售,10万级插混市场迎来“全能选手” 创维鸿途混动版正式申报,侧滑门,车长5490mm,7/9座布局 Similarweb 报告全球 AI 流量:Gemini 成 ChatGPT 最强劲对手 2025年天猫“双11”:实现四年来全周期最好增长 消息称三星三折叠屏手机已生产2万到3万部 有望年内发布 iPhone Pocket1299元起售,可当围巾甚至发绳,你会买吗? 威海瑞威房车:“产品+场景”打造“一站式户外生活”新生态 顶流IP下凡!特斯拉电摩曝光,4972元起售,这波品牌加持谁能拒绝 家用车天花板!全新丰田卡罗拉曝光,混动4L油耗+纯电 600km 轴距超3米1大SUV,承接尊界S800与问界M9中间空白? 丰田全新“小陆地巡洋舰”亮相,非承载式车身+四驱,混动系统兼 理想i9谍照首曝!明年亮相或许要成MPV“卷王” 300多项技术突破!中国6G领跑全球,但真正的标准大战才刚开始 高通推出跃龙IQ-X系列处理器 赋能工业PC与边缘智能升级 巅峰对决!江苏女排3-0完胜河南锁定头名,张常宁:珍惜每一场 我国完成第一阶段6G技术试验,形成300多项关键技术储备 马龙首秀胜利!赛后居然拍王楚钦屁股 没想到大头还调侃马龙 太逗了 英国男子垃圾桶 “寻宝” 上瘾!月赚 5600 元,捡过 1.4 万 Gucci 包 七星山荒野求生唯一女选手“冷美人”退赛 水下憋气4分钟!“水上芭蕾”是如何练成的? 全运男篮:四川逆转辽宁获季军,胡金秋主导战局,周琦末节定乾坤 银杏黄金周倒计时!6大秘境+2个宝藏地的终极玩法,错过再等一年 全运会游泳赛场:张展硕破纪录夺冠,潘展乐摘铜引热议