从机器学习到机器创造
买过西瓜吗?在我们买西瓜时,会接受大量的西瓜数据:外皮的颜色、纹路、敲打西瓜的声音,购买次数增多之后,就会生成一个西瓜模型(颜色鲜绿、纹路清晰、声音清脆的西瓜比较甜),当我们再一次选购西瓜的时候,就会通过这个西瓜模型来判断瓜甜不甜。
机器学习也是如此,计算机具备像人一样从数据中学习的能力。计算机接收程序员灌输的大量数据,通过学习算法生成模型,在积堆如山的数据中寻找、总结有用的知识,面对新情况时,模型会给出相应的判断。简而言之,机器学习就是通过算法,使得机器能从数据中学习规律,从而对新的数据进行识别或预测。借助机器学习,我们可以在数据中找到非直接的、隐含的数据结构,挖掘出数据之间的相关性及趋势,自动处理大量且复杂的信息,达到比人脑更快速地处理重复性的工作。
于是,诞生了许多非常酷的事件与应用。 例如,AI检测皮肤癌系统精准度首次超过了最出色的皮肤科医师,在识别恶性黑色素瘤方面的准确率为95%,而来自世界各地的58位皮肤科医生在这项诊断中的准确率不足90%,仅为88.9%。
人工智能在机器学习方面表现优异,非常擅于从数据中获取知识并应用。从那时起,人们又开始思考:是否可以通过数据学习的方式,让机器模拟人类的创造力? 一直以来,都是人类给人工智能出难题,让它挑战一项项任务,我们是否想过:也许人工智能可能拥有创造思维,反过来出题考倒我们人类呢?
当然!
究竟AI出题是如何实现的?
就像一个聪明的学生,在解题过程中不断积累知识点,能力逐渐由解题向出题转变,最终AI能通过知识点重新组合的方式来创造新题目。
整个过程共涉及四大阶段,分别对应智视科技四大核心技术:理解、学习、创造与推理。首先我们会教授系统一些基础常识和数学题,系统会对这些数学题进行理解和学习,完成知识、逻辑规则的归纳学习。其次根据用户输入的题目,通过创造和推理能力对已学习的知识与逻辑规则进行重组,自动生成多达上百道相关的数学题!
核心技术一:理解
回想一下,我们是如何学习数学定理(例如:拿破仑定理:以三角形各边为边分别向外侧作等边三角形,则他们的中心构成一个等边三角形),我们需要在脑海中先理解和分析定理的含义,再开始定理的学习与使用,显而易见:理解是学习的前置条件。
我们该如何保证机器准确理解数学题?直达本质的理解能力或许是最佳的切入口之一。通过对数学题文本数据进行分析,生成语义信息的形式化表示,从而使智视AI理解数学题的语义。在此过程中,同步进行多字少字的语义识别、不同表达的理解,根据数学题的上下文,从而精准掌握题意,进行正确学习。
这一技术不仅可作用于知识学习过程,同样作用于人机对话过程。在强大理解能力的支持下,AI能从用户简短、零散的日常话语中得以真正倾听用户的真实意图,彻底改变目前人机对话的“机械感”,让AI成为真正懂你的AI。
核心技术二:学习
在理解的基础上,智视AI能进行自主学习。模型具备从数据中学习知识的能力,并将知识运用与新信息的处理或具体问题的处理,智视希望“模型能够利用机器自身的能力从复杂数据中学习”,让数据不再是死数据,而成为系统的“课本”,让系统得以学习各科知识。
在此过程中,小样本学习也发挥不可忽视的重要作用。系统通过少量的事例,归纳总结出一般规律,从而大大减少同类型样本的需求量。相比深度学习需要10条以上的样本量进行训练,智视AI仅需3条,极大减少数据获取的工作难度与强度。
当AI系统拥有自主学习与小样本学习能力,那么 “场景样本数据少”、“场景数据标注成本高”等问题迎刃而解。例如在特定场景对话中,许多开发者在创建一个新对话任务时,并没有大量的对话数据,每个对话意图往往只有几个或十几个样本;还例如,一些公文的识别、分类和自动审校的应用场景中标注成本非常高,一份招股说明书多达几百页甚至上千页,需要一个数据员耗费好几天才能标注完一篇文档。在这些场景中都能利用智视AI自动且高效的学习能力,减少所需样本量,利用少量样本快速建模,提升自动化工具研发效率,给人们的工作、生活带来切实的提升。
核心技术三:创造
仅是学习知识是远远不够的,智视希望AI还能拥有对知识进行创造性应用的能力,在此体现为自动出题。
众所周知,学生能解题却不能出题,出题工作需要资深教师才能完成,这是由于出题难于做题,出题一定会解这道题,但是会解题不一定会出题。如果答题的难度是五星级,那么出题的难度一定超过五星级,而拥有创造能力的智视AI能成为一个“智能出题官”,根据有限的数据进行无限的重组创造,生成无限多的新题目,原理上可以生成2^32次方道题目,也就是42亿道题!
创造使AI效用最大化。传统AI只能根据人工输入程序完成重复性工作,例如识别、审核。在创造技术的支持下,AI能协助人们完成更多的工作,甚至是AI自动建模等许多过去不可想象的任务都将成为可能。正如上文所说,智视AI的创造能力是根据已有的知识与逻辑规则进行组合创造,这与建模过程非常相似,建模也是一个将数据、模型、参数三者进行组合创造,尝试得出最佳建模方式的过程。所以我们合理认为,当我们向智视AI教授建模知识之后,智视AI能创造性的完成建模工作。并且还将凭借人类难以匹敌的运算速度进行高效建模,在最短的时间内进行参数调节,完成建模任务,使建模更简单、易操作。
核心技术四:推理
不仅是出题,智视AI还能通过推理解答自己生成的题目!就像一个小老师一样,可以给学生出题,还能教导如何解答。
智视AI主要依靠系统学习知识点,形成逻辑推理能力后进行自主解题。在学习数学题之后,AI系统能够像人一样思考知识点和解答,并一步一步输出解题过程。解题过程中,会按照推理思维,尝试各种方法,对于一些复杂的难题,智视AI甚至会尝试上百种方法进行解题。
这一能力有效弥补目前在线题库、拍照搜题类APP面临的困境:题库不具备“成长性”,只能解答题库中收录的题目,不断的填充题目数据以满足学生需求,但即使是拥有2.5亿大数据题库的作业帮依旧没法做到解决用户的所有问题,而智视AI不依赖题库,不通过检索数据库中相同题目,复制解题过程的方式进行答疑,而是通过例题学习知识,借助推理进行解题,在低数据成本的基础上,解题范围远超现有应用。
自动出题技术的应用场景有哪些?
智视AI的相关技术成果可以在教育全过程中起到非常大的帮助,比如自动出题(作业、考试)、自动批改、智能答疑、题目推荐等等方面,极大的降低老师工作强度,提升效率,促进个性化。
自动出题技术极大降低出题成本,使得为每个学生布置不同的课后习题作业,进行千人千卷的考试成为可能。这就意味着抄袭将变得困难,每个学生必须经过自己独立思考进行解题。
同时,也可以自动批改作业与阅卷。除了选择或填空题,也可实现对应用题的自动批改。通常在数学证明题中,证明的结论只有一个,但是证明过程可以有几种。传统的自动批改作业系统,只能根据标准答案,通过数学符号语言处理等算法,生成几个同义表达式,从而尽可能“宽容”的进行批改。但这并不能涵盖证明题的所有解法,所以常出现对与标准答案不符的作业产生误判。智视AI可以依照学生的证明过程进行推理,判断能否完成推理闭环,证明题目所要求的结论,提高批改的准确性与个性化。
应用场景还有非常的多,比如智能答疑、题目推荐也是很好的应用场景。目前我们教育经常提到“自适应学习”的场景,而实际在操作中,自适应题目推荐缺乏一个有效的对大量题目进行高精度分类的引擎。传统的基于文本相似度的推荐题目的算法很难保证推送出来的题目跟原题考的是同样的细节。这个就影响了学生在做错题练习时候的效果。使用智视AI的情况下,只要题目能够被解出来,就能够很准确的判断这道题属于什么知识点,在此基础上可以推送跟它在逻辑上比较接近的题目。同理,只要题目能被AI系统解答,系统就能解释解答步骤,为学生提供智能答疑服务。
也许我们正在见证一种新AI的诞生,能自动出题,拥有理解、自主学习、推理、创造思维的新机器,甚至让AI代替人类工作成为可能。输入数学、物理、化学等领域的习题或资料,系统就能自主归纳知识,并对知识进行灵活运用,面对实际场景中不断变动的条件,做出适应性调整,从而代替人类完成工作,以低成本为企业创造更多收益,推动社会发展与进步。