.:. 草榴社區 » 技術討論區 » 今年这篇高考作文,连潘周聃都说“开挂了”[7P]
本頁主題: 今年这篇高考作文,连潘周聃都说“开挂了”[7P]字體大小 寬屏顯示 只看樓主 最新點評 熱門評論 時間順序
事了拂衣去


級別:光明使者 ( 14 )
發帖:2472
威望:17389 點
金錢:20736 USD
貢獻:29999 點
註冊:2011-06-06

今年这篇高考作文,连潘周聃都说“开挂了”[7P]


 

“围棋是一门复杂多变的技艺,倘若急于求成而忽略了基础的稳扎稳打,那么再高超的技艺也会变成再损己不过的招式。围棋中的“本手、妙手、俗手”与我们的生活日常不是也正息息相关吗?”
很难想象,这句话的作者是一名数字人。
每年高考第一天,给作文题出各种五花八门的解题思路是一场全网狂欢。今年,加入挑战者大军的数字人是 “度晓晓”。据悉,她能在40秒内写完40篇高考作文,上述文章在直播中限时完成,获得了语文名师48分的评价(满分60)。《最强大脑》选手、“学霸”“网红”潘周聃在看到作文后直言“这有点开挂了”。
借助AI搞创作已不是什么新鲜事,AIGC(AI-generated Content,用AI创造的内容)也早已走出实验室——网站可以根据文章内容自动生成合适的标题;彭博新闻社采用机器人系统Cyborg大量撰写新闻资讯和财报文章;Netflix的机器人在“看了”40万个小时的恐怖电影之后,自己制作出一部恐怖迷你短篇……
但关于AIGC的质疑始终存在。度晓晓的作文引经据典却少了一些人文情感;彭博的系统对于需要采访、形成观点评论的深度调查仍然束手无策;Netflix的恐怖电影尽可能地杂糅了各种恐怖元素,但最终呈现却缺乏剧情逻辑,反倒更像一部无厘头喜剧。
人与AI机器人混居的时代尚未到来,但我们似乎有必要了解AI们的能力行至何处了?AIGC的水平究竟发展到了什么阶段?我们能如何利用?未来还有哪些更多的可能性?
 
Netflix出品的一个AI制作恐怖短篇
剧情、画面怪异
是个究极缝合怪
图源:视频截图
AI引领内容生产变革
2020年百度世界大会上,度晓晓作为移动端的虚拟助手首次出现在公众面前,是百度对搜索创新的一个尝试,代表了未来的搜索形态和人机互动趋势。百度大脑7.0核心技术驱动的度晓晓,整合了多模态交互技术、数字人建模、机器翻译、语音识别等多项技术,拥有实时交互、陪伴养成、开放式AIGC的能力。
具体到使用情景中,用户可以随时唤醒度晓晓通过对话进行搜索或者下达控制指令,而与苹果的Siri、亚马逊的Alexa等最大的不同是,度晓晓具有一个数字人形象。这意味着,她不仅是个完成指令的语音助手,而且是个更多才多艺、亲切可感的陪伴型虚拟人。面对不同用户的性格和爱好,度晓晓会差异化反馈,从而养成出“个性”,同时,她的AIGC能力正在向外发展,助力更多媒体和内容从业者。
举几个例子:在今年两会期间,百度联合工人日报、科技日报,让度晓晓与报道两会的记者、主播朋友们一起上岗,与真人同框,播报和解读新闻;她也与科普中国、光明网一起,作为主播参与到军事科普节目《强军路上国之重器十年巡礼》中;世界读书日,度晓晓来到樊登读书为读者们荐书并讲解《技术与文明》。
 
度晓晓作为樊登读书“荐书官”
不难发现,AI生产的内容已经远不是过去人们认知中“机械化”、“简单化”、“直接化”的代码式语言了。在上一个阶段,机器通过人们设定的既定程序,按部就班地生成风格一致的内容。虽然彼时AI确实也能创作一些作品,但那更多的是“拼凑”、“排列组合”、“套模板”,缺少逻辑与情感,更没有自我表达。
而在这个阶段,丰富的知识图谱、海量的数据支撑、智能的计算思考、富有人情味的传达……这些技术进步让AIGC更加“高质量”。一方面可以为人类节省重复生产的时间精力,或者理解信息并作为人类的辅助、帮你把问答题变成选择题从而激发灵感;另一方面则开始做一些真正有创造力的事情了。
离满分还差多远?
度晓晓的这次作文挑战一定程度上体现的就是AIGC的“理解力”和“创造力”。
以“围棋”作文题为例,其题眼是围棋的三个术语“本手、妙手、俗手”。本手是指合乎棋理的正规下法;妙手是指出人意料的精妙下法;俗手是指貌似合理,而从全局看通常会受损的下法。本手是基础,妙手是创造。
这道作文题的题干并没有复杂的诗句,字面意思非常容易理解。但难度在于要通过围棋的下法延伸出自己的理解。这也是度晓晓面对的挑战,相较于问答、播报等内容形式,高考作文绝非“答案检索”,如果只是机械读题,“人工智障”很可能写出一篇围棋指南。
上下滑动查看全文
 
从最终呈现的《苦练本手,方能妙手随成》一文中可以看出,度晓晓在审题这一关展现了很强的语义理解能力,内容紧扣主题,立意明确。 一句“苦练本手,方能妙手随成,成就人生传奇”,非常清晰地点出了本手与妙手之间的关系,并将启示从围棋升华到了人生高度。
成文方面,在逻辑上,文章的结构完整、论证清晰,从强调本手的重要性开始,到肯定宽阔视野、想象力(妙手)的意义,最后结合论证,文末点题;在语言表达上,度晓晓知识储备方面的优势非常明显,引经据典,项羽、韩信、毕加索的故事和名言随手拈来,而且善用排比、比喻等修辞手法;而在效率上,度晓晓恐怕是超过了100%的考生——40秒能创作40多篇作文。
最终,知名语文老师申怡老师给文章打了48分成绩,度晓晓的作文分数已赶超约75%高考考生。“文科生在作文写作上还是输给了理科生。”一位网友的评论获得了高赞。
 
网友对度晓晓的作品议论颇多
图源:微博截图
度晓晓是如何做到兼顾高效率和高质量的?其背后的核心技术是自然语言处理(NLP),同时也涉及数据挖掘、知识图谱等多项人工智能技术。百度的文心大模型ERNIE3.0 Zeus可以说是度晓晓的“指导老师”。
众所周知,AI技术的驱动力主要是巨量数据,而当AI应用深入各行各业,商业化步入深水区的阶段, 如何减少数据标注量、如何提高开发效率、如何降低应用成本是AI企业们思考钻研的问题。因此,“大模型”成了AI研究中最受关注的领域,是与硬件、芯片、框架等同等重要的AI基础设施的一部分。
AI大模型,指预训练大模型,是机器学习的一种方式。如果将人的学习阶段分为通识教育与专业教育,进行一个类比,大模型可以解决机器的通识教育部分。机器可以通过自监督学习的方法让模型对海量无标注数据中的规律和知识进行提炼和学习,当面向具体任务和场景的时候,只需要少量的任务标注数据即刻调用出好用的模型。这样一来,AI应用开发者摆脱了对精标数据的依赖,AI也加速渗透应用到了各个场景中。
从2010年开始,百度便深耕AI技术,打造了中国第一个自主研发、开源开放的产业级深度学习平台飞桨,这相当于人工智能时代的操作系统。基于飞桨,百度打造了具备“知识增强”能力的预训练大模型“文心大模型”。这是百度打造的AI基础设施的重要组成部分。
度晓晓写作文这一场景的技术基础,是文心大模型最新推出的NLP基础大模型ERNIE 3.0 Zeus,其可以被应用于智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务。
 
NLP基础大模型ERNIE 3.0 Zeus
不过,我们也能看出技术尚在进阶中,度晓晓作品离“满分作文”还有一段距离。
在《苦练本手,方能妙手》一文中,度晓晓用了网络热词“YYDS”,虽然意思上贴切,但显然不符合高考作文的标准,是个扣分项。据「百度相关负责人」肖阳的解释,这是由于模型学习了一些网络热门数据。
另外,很明显的阅读感受是,度晓晓的这些文章,套路感满满,只能说是中规中矩,并无惊艳之感。虽然语言流畅、对仗工整且用典颇多,但是文章在人文哲思维度说还是稍欠火候,堆叠的排比句也像是在掉书袋。
类似的质疑也发生在其他的AIGC实践上,AI可以通过大规模的数据输入以及模型训练,很好地完成模板化、套路化的内容,但是少了份灵气。
这或许也能回应人们一直以来的恐慌——“内容创作者是否会被AI所替代?”。现在看来还远远不会。
AI在内容创作领域的价值体现在展示创作的多样性、提升生产的效率,把人从一些重复性高且琐碎的工作中解放出来,但其工具的属性并不会改变。
价值不止于“作文”
其实,除了内容生产,我们生活、工作中,AI可谓无所不在:拿起手机刷视频,首页是算法推荐;接到快递或者网店的客服电话,说话的很有可能是bot;进入小区,我们用人脸识别来开锁。
总体来看,AI的娱乐化和服务化是普通用户最看重的地方。前者常用在社交网站、短视频网站,帮我们“杀时间”,后者则是帮我们“节省时间”,而其中最典型的运用就是搜索,用户带着明确的目的想要获得更多更大更权威的信息,并且根据这些信息满足相关需求。在这方面,搜索与AI技术均处于领先地位的百度占据一定优势。
比如高考,考生的核心诉求就是搜集和筛选最核心的权威信息,什么时候查分,怎么填报志愿,高校的基本信息等等。而百度利用搜索和AI优势,把百度APP打造成了人格化服务的一站式体验中心,用户不用频繁切换各类应用就能在站内满足信息与服务的需求。
今年,百度APP推出了智能估分、AI高考档案、AI志愿助手、AI对比分析等多个智能报考服务。度晓晓不仅仅写作文跟考生们“同台竞技”,还当起了高考数字人助理,可以实现智能化的报考推荐、查分报志愿等重要节点的个性化提醒等功能,甚至可以与考生聊天,帮助考生缓解压力。
 
高考数字人助理度晓晓
此外,百度也与华为、荣耀、OPPO、vivo、小米、三星等国内外多家终端厂商协同,将考试院、高校官网等展示在自然结果首位,确保官网信息和权威渠道的优先显示,助考生得到最清晰准确的信息;还联合了携程、同程旅行等OTA企业,推出高考房预订服务。
这都是AI时代信息服务创新性在具体场景中的体现。
近两年,数字人/虚拟人伴随着元宇宙概念的起飞热度居高不下,从初代的洛天依、初音未来,到现在的柳夜熙、AYAYI等等不断涌现。
行业初期,既是百花齐放,也是泡沫重重。数字人要大规模落地还面临诸多阻碍,比如产业链节点的的割裂、服务场景和演艺场景中间的壁垒、数字人生产效率低且成本高等等。这导致很多数字人只停留在一个完美的形象,辨识度不高,昙花一现,背后的技术协同集成的不到位和应用场景的不清晰是最大的痛点。
但行业强劲的驱动力和广阔的前景是具有确定性的。据市场研究机构量子位《2021年虚拟数字人深度产业报告》预计,到2030年我国虚拟数字人整体市场规模将达到2700亿元。
打开数字人产业价值空间,有两个关键词:有技术、且有用。
度晓晓或许是个恰如其分的例子,有百度AI技术做支撑,并且有百度多元业务做试炼场,在ToB/ToC的多场景沉淀经验,不断“成长”,并且取代搜索框,成为一个生动的入口。
对于度晓晓来说,高考作文只是再寻常不过的一个小测试,通过这样一个国民高关注度的挑战进一步向大家“普及”数字人的能力,而回归到日常,数字人+AI的组合还需要更多的技术迭代、各方支持、场景落地与耐心等待。



赞(13)
DMCA / ABUSE REPORT | TOP Posted: 06-09 23:13 發表評論
.:. 草榴社區 » 技術討論區


電腦版 手機版 客戶端 DMCA
用時 0.01(s) x3, 06-07 06:26