李开复:从1983到2017,我的幸运与遗憾

  • 时间:
  • 浏览:0
  • 来源:极速赛车网投平台-江苏快3投注平台_排列3娱乐平台

  文/李开复

  1

  今天跟当让我们让我们让我们 讲个故事。

  1983-1988年,我正在卡内基·梅隆大学读计算机博士。

  我正忙着暑期教书,秋天投身奥赛罗人机博弈(黑白棋游戏,那是机器第一次真正意义上打败人类冠军的比赛)。

  我的导师瑞迪教授(Raj Reddy,图灵奖得主、卡内基梅隆大学计算机系终身教授、美国工程院院士)从美国国防部得到了200万美元的经费,用来做不指定语者、大词库、连续性的语音识别。

  也好多好多 说,他希望机器能听懂任何人的声音,有过后都需用懂上千个词汇,懂当让我们让我们让我们 自然连续说出的每语句。

  这一个多多问题 时会当时无解的问题 。

  而瑞迪教授大胆地玩转信用卡 项目,希望一起处置这一个多多问题 。他在全美招聘了200多位教授、研究员、语音学家、学生、程序运行运行员,以启动这一有史以来最大的语音项目。

  我也在这200人名单之内。

  当时的科研背景是,业界原应着有类式今天深度1学习的算法,但总爱越来越 实现数据标准化,数据量也缺陷够大。

  美国几大语音识别实验室(如MIT、 CMU、 SRI、 IBM、贝尔实验室)时会各用各的数据库,测试数据不同,训练数据不同,使用的语言模型不同,测试的词汇量好多好多 同。好多好多 都各称业界第一,当让我们让我们让我们 莫衷一是。

  而每个大公司时会自己的商业需求,比如说在语音识别方面,当年做打字机的IBM想做语音打字机,垄断美国电信的AT&T要求贝尔实验室识别电话号码,好多好多 大公司并越来越 动力来帮助小公司或学校。而小公司和学校,往往越来越 资源做些较小的数据集,结果通常好多好多 如大公司的好。

  不仅越来越 ,数据不标准对AI研究而言是致命的,最后原应着好多好多 问题 ,包括:

  1、原应着测试语料库不同,最后识别结果,当让我们让我们让我们 无法克隆技术,也无法验证。彼此不认可,有过后原应着数据越来越 打通,算法就更不原应着打通了。

  2、原应着每家做的领域不同,最后的结果时会可比。许多领域词汇量小,比较容易,有过后做出结果也原应着越来越 通用。许多领域词汇量大,有过后约束好多好多 ,好多好多 能说的内容不要 ,原应着比较容易识别,好多好多 能通用。

  3、原应着每家训练集不一样大,而训练集越大,一般结果越好。好多好多 ,有原应着结果做的好,被认为并时会靠算法,好多好多 靠数据量大。

  4、对于学术单位来说,最大的问题 来自于越来越 足够的资源(也越来越 兴趣)整理、清洗、标注絮状的语料。对于小公司来说,语料和计算力时会问题 。

  最后,瑞迪教授计划采用“专家系统”来完成项目,原应着这一法律最好的方法需用的数据有限。

  专家系统是早期人工智能的三个小多多重要分支,让他把它看作是一类具有专门知识和经验的计算机智能程序运行运行系统,一般采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家无需 处置的繁复问题 。

  但我不认同。

  2

  过后参加过的奥赛罗的人机博弈,我想对统计概念有了充分的理解,我对瑞迪教授的研究法律最好的方法产生动摇。

  我相信建立大型的数据库,有过后对大的语音数据库进行分类,有原应着处置专家系统越来越 处置的问题 。

  另外,在1985年,美国标准局 (NationalInstitute of Standards and Technology)也意识到数据不标准会影响科研进步。好多好多 在语音识别问题 上,标准局设定了标准的语音和语言的训练集、测试集。要求每个学校的每个团队都用同样的训练集来训练模型,都需用自己调好系统参数,比赛最后一天当让我们让我们让我们 拿到数据,有一天时间跑出结果,当让我们让我们让我们 评比。

  我从这一标准数据集和测试想看 原应着。

  再三思考后,我决定鼓足勇气,向瑞迪教授直接表达我的想法。我对瑞迪说:“有过后转投统计学,用统计学来处置这一‘不特定语者、大词汇、连续性语音识别’。”

  我以为瑞迪会许多失望,没想到他许多都越来越 生气,他轻轻地问:“那统计法律最好的方法何如处置这三问题 报告 呢?”

  瑞迪教授耐心地听完我激情的回答后,用他那永远温和的声音我不知道:“开复,你对专家系统和统计的观点,我是不同意的,有过后他想支持你用统计的法律最好的方法去做,原应着我相信科学越来越 绝对的对错,当让我们让我们让我们 时会平等的。有过后,我更相信三个小多多有激情的人是原应着找到更好的处置方案的。”

  那一刻,我的感动无以伦比。原应着对三个小多多教授来说,学生要用自己的法律最好的方法作出三个小多多与他唱反调的研究。教授不但越来越 动怒,还给予充分的支持,这在好多好多 地方是不可想象的。

  统计学需用大数据库,当让我们让我们让我们 何如无需 建立起大的数据库呢?

  瑞迪教授想看 我愁眉不展的样子,再一次给了我支持。你说什么,“开复,虽然说我还是对你的研究法律最好的方法有所保留,有过后,在科学的领域里,虽然也无所谓老师和学生的区别,当让我们让我们让我们 时会面临这一个多多问题 的攻克者,好多好多 ,原应着你真的需用数据库,越来越 ,我想去说服政府帮你建立三个小多多大的数据库吧!”

  瑞迪教授过后说服了美国政府部门和美国标准局整理并提供了絮状数据。我用美国标准局提供的标准大数据,跟多家拿国家钱的机构数据,过后许多不拿国家钱的单位(如:IBM,AT&T)也参与进来,我可使用的数据越滚越大。

  除了大数据,统计学的法律最好的方法还需用非常快的机器,瑞迪教授又我想购买了最新的Sun 4机器。此后每次有新的机器,他时会说:“先问问开复要并不。” 做论文的两年多,我为宜花了他几十万美元的经费。

  瑞迪教授的宽容再次我想感觉到两种伟大的力量,这是两种自由和信任的力量。

  3

  在导师的支持下,我始于英文了疯狂的科研工作。

  当时,我带着另一位学生一起用统计的法律最好的方法做语音识别。一起,许多200多人用专家系统做同样的问题 。从法律最好的方法上来说,当让我们让我们让我们 在竞争,有过后在瑞迪教授的领导下,当让我们让我们让我们 分享一切,当让我们让我们让我们 用同样的样本训练和测试。

  在1986年底,我的统计系统和当让我们让我们让我们 的专家系统达到了为宜一样的水平,40%的辨认率。这一太好还是删剪越来越 用的系统,但毕竟是学术界第一次尝试越来越 难的问题 ,当让我们让我们让我们 还是比较欣喜和乐观的。

  1987年5月,当让我们让我们让我们 大幅度地提升了训练的数据库,采用了新的建模法律最好的方法,不但无需 用统计学的法律最好的方法学习每三个小多多音,有过后都需用用统计学的法律最好的方法学习每三个小多多音之间的转折。针对许多音的样本缺陷,我又想出了两种法律最好的方法(generalized triphones)来合并许多的音。这三项工作果真把机器的语音识别率从从前的40%提高到了200%!过后又提高到96%。

  统计学的法律最好的方法用于语音识别初步被验证是正确的方向。

  当让我们让我们让我们 都相信了我用的机器学习法律最好的方法和隐马可夫模型算法,有过后抛下了不可行的专家系统(专家系统只达到200%的识别率)。在我的博士论文基础上,过后的Nuance,微软、苹果手机6等公司做出了业界最领先的产品。

  1988年4月,我受邀到纽约参加一年一度的世界语音学术会议,发表学术论文。

  这一成果撼动了整个学术领域。这是当时计算机领域里最顶尖的科学成果。

  语音识别率大幅度提高,让全世界语音研究领域闪烁出一道希望的光芒,从此,所有以专家系统研究语音识别的人删剪转向了统计法律最好的方法。

  会后,《纽约时报》派记者JohnMarkoff来到匹兹堡对我作了采访,文章发表于1988年7月6日,占了科技版首页的整个半版。在这篇文章里,马可奥夫大力报道了我的论文的突破。当时,我只虽然在和三个小多多和蔼可亲的记者聊天,事后,我才知道这是一名才华横溢的著名记者,三次提名普利策奖,并在斯坦福兼教。

这是1988年,《纽约时报》对我博士论文的报道

  过后,《商业周刊》把我的发明者者选为1988年最重要的科学发明者者。年仅26岁初出茅庐的我,第一次亮相就获得从前的成功,我想感到很幸运,也我想有了继续向科技高峰攀爬的动力。

  而我也有过后拿到了卡内基·梅隆大学的计算机博士学位,这离我1983年入学越来越 4年半的时间。在卡内基·梅隆大学的计算机学院,同学们平均6年以上无需 拿到博士学位,我用越来越 短的时间拿到博士学位,是一项新的纪录。

  我也有过后破格留校,成为一名26岁的助理教授。

  4

  遗憾的是,虽然我找到了方向和基本法律最好的方法,但以当时的数据量级和计算水平,语音AI研究比较慢有商业化原应着。我最终还是抛下科研界,进入商界,用产品改变世界。

  200年过了,AI发展的土壤终于肥沃起来。

  伴随互联网和移动互联网而来的大数据、高效的计算机运算能力等条件都齐备了。科研人员需用的数据集不再越来越 难以触碰,好多好多 需用人们牵头让更多的公司参与进来。这在200多年前,我还是三个小多多AI科研人员的时代,能接触到真实世界里越来越 海量的数据,是个遥不可及的梦想。

  我当年受惠于瑞迪教授的帮助和指导,今天也非常希望能给更多和我一样的年轻人,创造研究原应着和条件。

  好多好多 ,昨天创新工场、搜狗、今日头条联合发起“AI Challenger 全球AI挑战赛”。三家公司分别投入絮状资金、也玩转信用卡 千万量级高质量开放数据集与宝贵GPU资源。

  一起,我也倡导商界和科研界能采用絮状的数据和标准的测试法律最好的方法,也欢迎更多的数据公司无需 参与到这一平台里。

  希望当让我们让我们让我们 推出的Challenger.ai,都需用帮助到中国AI人才成长。

  在我看来,这次AIChallenger绝对不好多好多 三个小多多活动,也绝对不好多好多 三个小多多奖金200万、年底就始于英文的竞赛,这是推进中国AI人才成长的重大催化剂。

  希望3年或5年后,当让我们让我们让我们 再来回顾这一段时光里匆匆,当让我们让我们让我们 发现中美AI人才之间越来越 落差了,还能想到AI Challenger在从前重大过程中扮演了三个小多多小小角,让他感到这一切时会价值。

  欢迎当让我们让我们让我们 登录大赛官网Challenger.ai,获取信息并报名。关于这场大赛的具体信息可点击文末的链接了解(要在电脑页面上无需 报名哦)。

  当让我们让我们让我们 原应着无法想象,我有多么羡慕当让我们让我们让我们 ,生活在数据爆炸的时代,人们提供数据和奖金池,让有才华的人一展拳脚。

猜你喜欢

杰和AI视讯零售方案即将亮相2019 ISVE智慧显示展

【前言】杰和科技将携自研的GDSMAI人脸识别处置方案及多款智能硬件及主板(包括多屏拼接播放器、X86系列播放器、ARM系列播放器、AI播放器以及主板产品)亮相2019深圳(国

2019-12-15

摩托罗拉One Hyper正式发布 售价400美元

据外媒报道称,摩托罗拉OneHyper现已在欧洲和拉丁美洲的部分国家/地区正式发布,售价为50美元。摩托罗拉OneHyper配备一块6.5英寸LCDIPSHD+屏幕,搭载高通骁

2019-12-15

好站推荐第三百三十二期:轻流

网站名称:轻流网站网址:https://qingflow.com/网站排名: 未被网站排行榜收录,提交收录。点击查看中文网站TOP5000排行榜。网站简介:流程化团队合作工具,

2019-12-15

京东新开的电器体验店比7个足球场都大,55个体验区等你逛

"这是城市科技的新地标"这是重庆领导刚调研完京东超级体验店时说的话。京东搞了个那些地标性项目呢?据了解,京东在重庆开了一有几个 全球最大的电器产品体验店,足足5万平米。目

2019-12-15

TCL三折手机原型机曝光:尺寸接近平板 打开和折叠状态都能用

10月24日,外媒展示了TCL的一款三折屏幕手机,因其存在原型机阶段,目前规格、价格、销售时间尚不明确。该手机的理念和每1个多多 折叠手机一样,带来尽肯能大的屏幕,一同让所占

2019-12-15