AI读论文新神器:多栏密集文字、中英图文混排文档都能读|旷视
Fox团队投稿量子位|公众号QbitAI虽然多模态大模型都能挑西瓜了,但理解复杂文档方面还是差点意思。面对文字密集、多栏混排等文档时往往力不从心,区域级别的细粒度理解,就更是无从谈起了。最近,旷视团队打造了一支多模态大模型的“点读笔”——Fox,轻松实现对8页文档(
腾讯大模型APP腾讯元宝上线,公司2、3月已申请“腾讯元宝”商标
5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,腾讯元宝聚焦AI效率工具,提供了AI搜索、AI总结、AI写作等核心能力,能够一次性解析多个微信公众号链接、网址,以及PD
Firefox 火狐浏览器 126 版更新修复 PDF.js 漏洞
IT之家5月28日消息,Mozilla基金会在 5 月 14 日推出了Firefox 火狐浏览器126版本,官方在更新信息中提到该版本主要修复了浏览器内置的PDF组件(PDF.js)中一项高风险漏洞CVE-2024-4367。据悉,这项“CVE-2024-4367” 代码执行漏洞
安卓版 Acrobat 将支持本地调用 Gemini Nano 汇总 PDF 文档内容
IT之家5月23日消息,开发者米沙尔・拉赫曼(MishaalRahman)昨日发布博文,表示Adobe公司将充分利用GeminiNano模型,计划在安卓新版Acrobat中实现汇总文档内容等AI功能。谷歌推出了名为AICore的全新工具,可以让应用开发者调用GeminiNano本地模型。谷歌基
HuggingFace教你怎样做出SOTA视觉模型
克雷西发自凹非寺量子位|公众号QbitAI前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开
工信部公布《国家工业和信息化领域节能降碳技术装备推荐目录(2024年版)》
工信部网站5月17日消息,为加快推广应用先进适用节能降碳技术装备,推动重点行业领域节能降碳,现将《国家工业和信息化领域节能降碳技术装备推荐目录(2024年版)》予以公告。以下为原文中华人民共和国工业和信息化部公告2024年第8号为加快推广应用先进适用节能降碳技术装备,
为什么零售数字化解决方案有需求,但并不好卖?
现在,品牌商和零售商面临着传统渠道增长难等问题,而数字化解决方案提供商则面临着目标客户获取难等问题。那么,品牌商/零售商与解决方案服务商之间,是否能够实现双向奔赴?服务商要如何让品牌商放心地与其合作?一、概念说明1.提供数字化解决方案的服务商在营销管理、供应
谷歌宣布Gemini AI融入Android 15系统 手机变得更聪明
【CNMO科技消息】5月15日凌晨,谷歌在I/O大会上宣布,Android15将深度整合其Gemini大模型,为用户带来一系列前沿的AI功能。其中,备受瞩目的即圈即搜功能将不仅限于搜索物体,更增加了截图与题目解答的智能化处理。用户只需圈选题目,Android15便能迅速提供解题思路与答案,