Google Jeff Dean: 通过三种方式,AI 正在全球扩展为有益人类的技术

2个月前 (11-16 04:23)阅读1回复0
猪脚
猪脚
  • 管理员
  • 注册排名6
  • 经验值102100
  • 级别管理员
  • 主题20420
  • 回复0
楼主

做者:Google研究院高级研究员,副总裁Jeff Dean

1990年,仍是本科生的我接触到了神经收集。那时,AI界的许多人都对神经收集的潜力感应兴奋,它们令人印象深入,但还不克不及完成重要的、现实世界里的使命。我其时也对此十分兴奋,我的结业论文就是关于若何利用并行计算来操练神经收集,认为我们只需要32倍的算力就能到达目标。我的设法大错特错。其时,我们现实需要100万倍的算力。

短短21年后,跟着算力的成倍增长,是时候再一次测验考试神经收集了。2011年,我和Google的其他几位同事起头从YouTube视频中随机抉择的数百万视频帧数据来操练浩荡的神经收集。成果长短常惊人的。在没有明白操练目标的情状下,该系统主动学会了识别差别的物体(出格是猫,YouTube上四处都是猫)。那是AI继续获得停顿旅程中的一个变化性发现,那些停顿仍在Google和其它处所延续。

我之所以跟各人分享我的神经收集汗青是想阐明,固然如今各人可能会觉得AI的停顿特殊快,但它是来自于一个漫长的前进弧线。事实上,在2012年之前,计算机还很难看到、听到或理解口头或书面语言。在过往的10年里,我们在AI范畴获得了飞快的停顿。

今天,我们对Google在AI范畴获得的许多最新停顿感应兴奋——不只在手艺范畴,并且是在以负责任的体例操纵AI搀扶帮助全世界的人。那也意味着在Google Cloud、我们的产物(从Pixel 手机 到 Google Search)以及许多科学范畴和其别人类活动中都运用了AI。

同时,我们意识到AI做为一项新兴手艺所带来的挑战和风险。我们是第一家发布和施行AI原则的大公司,现实上,遵照那些原则(有些人可能认为那违背曲觉)使我们可以专注于在对全人类都有搀扶帮助的手艺上获得快速停顿。准确的AI需要集体的勤奋——不单单是研究人员,还包罗各个范畴的专家、开发人员、社区成员、企业、政府和公民。

今天,我很兴奋公布 Google AI在三个变化性范畴获得停顿:第一,AI可以让手艺被更多语种的人利用。第二,AI能够搀扶帮助提拔创意。第三,AI能够搀扶帮助处理社会面对的严重挑战,包罗对天气改变的适应。

1. AI 手艺撑持 1,000 种语言

语言是人们交换和熟悉世界的根本体例。所以它也是人们与手艺互动的最天然体例。但是,全世界有超越7000种语言,而今天却只要少数语言可以在互联网上得到优良表现。那意味着,在收集文本上操练语言模子的传统办法已经无法适应全球交换体例的多样性。那点历来是我们实现“整合全球信息,供群众利用,让人人受益“ 那一任务的一大障碍。

展开全文

那就是为什么 Google 今天要公布“一千种语言方案”。那是一个雄心壮志的方案,它许诺往构建一个可撑持1000种最常用语言的AI模子,它能为世界各地边沿化群体的数十亿人带往更大的宽大性。那将是一项继续停止多年的事业——有人以至称它为“登月动作”——但我们已获得了有意义的停顿,并清晰地看到了将来。从人们利用它的体例到手艺本身的才能,手艺不断在快速改变。我们越来越多地看到人们通过图像、视频和语音等新形式来觅觅和分享信息,而Google更先进的语言模子是多形式的,那意味着它们可以解锁那些差别格局的信息。跟着那些变化性的巨变,新的时机也随之而生。

! 图片上传失败:上传文件大小不克不及超越6M!

做为该方案以及对多形式存眷的一部门,我们已经开发了一个通用语音模子(USM)。它撑持超越400种语言,那使其成为了迄今为行笼盖范畴更大的语音模子。跟着我们那项工做的扩展,我们正与世界各地的群体协做,以获取有代表性的语音数据。比来,通过与非洲的研究人员和组织密切协做,我们近期公布在Gboard上为别的9种非洲语言输进语音,以创建和发布数据。而在南亚,我们正积极与本地政府、非政府组织和学术机构协做,最末搜集了来自所有地域方言和语言中有代表性的音频样本。

2. 用AI赋能创做者和艺术家

由AI赋能的生成式模子具有释放创造力的潜能,搀扶帮助差别文化布景的人们用视频、图像和设想来表达本身,那一点在以前是无法做到的。

Google的研究人员不断努力于开发在量量方面领先行业的模子,Imagen和Parti生成的图像比其他模子更受测评员们的喜爱。比来,我们分享了包罗Imagen Video和Phenaki在内的两项重要打破,前者是我们利用于视频序列的扩散模子,后者是为文本提醒序列生生长而且连接视频的模子。那些团队不断在协做,利用那两种模子造造视频。今天我们初次分享了由AI生成的超辨认率视频。

我们很快就会把我们文本到图像生成手艺带到AI Test Kitchen,它为人们供给了一个领会、体验和反应新兴AI手艺的渠道。我们等待在第二代AI Test Kitchen中听到用户对那些演示的反应。你将可以用 "城市梦想家(City Dreamer) "建造主题城市,用 "Wobble"设想可以挪动、跳舞和跳跃的友好怪物角色。所有那些都能通过文本提醒(text prompts)来实现。

除了二维图像之外,文字转3D如今已经成为现实,DreamFusion能够生成一个能从任何角度看看,并合成到任何三维情况中的三维模子。研究人员在音频生成范畴也获得了严重停顿,AudioLM是一个仅通过聆听音频样本就能进修生成传神语音和钢琴音乐的模子。就像语言模子能够揣测文本提醒后的单词和句子一样,AudioLM能够揣测在音频提醒几秒钟后应该有哪些声音。

当我们开发那些东西时,我们与全球的创做者群体协做。例如,我们目前在与利用Wordcraft的做家们协做,来试验由AI赋能的文本生成。该系统成立在我们更先进的对话系统LaMDA上,您能够在Wordcraft Writers Workshop上阅读那些故事的第一卷。

3. 用AI手艺应对天气改变和安康挑战

AI手艺在缓解天气改变的影响方面也颇具潜力,包罗搀扶帮助人们适应新的挑战。此中最严峻的是至今仍在影响数十万人、且频次和规模都有所扩展的野火。

今天,我很兴奋地与各人分享,我们改进了对卫星图像的利用以操练AI模子往识别和实时跟踪野火,从而搀扶帮助揣测野火将若何演变和蔓延。我们已经在美国、加拿大、墨西哥和部门澳大利亚地域推出了那个野火逃踪系统。自7月以来,我们报导了美国和加拿大的30多起大型野火事务,用户和消防队在Google Search和Maps上看看看野火情状达700多万次。

图注:挪动端的野火逃踪项目

我们还利用AI来揣测洪水,那是另一种因天气改变而加剧的极端气候形式。我们已经搀扶帮助印度和孟加拉国的社区揣测洪水来袭的时间和水深。2021年,我们通过Google Search和Maps向2300万人发送了1.15亿条洪水警报通知,搀扶帮助挽救了无数的生命。今天,我们要分享的是,Google的洪水揣测笼盖范畴扩展到南美洲(巴西和哥伦比亚)、撒哈拉以南非洲(布基纳法索、喀麦隆、乍得、刚果民主共和国、象牙海岸、加纳、几内亚、马拉维、尼日利亚、塞拉利昂、安哥拉、南苏丹、纳米比亚、利比里亚和南非)和南亚(斯里兰卡)的更多国度。我们利用了一种称为“迁徙进修(Transfer Learning)”的AI手艺,使其在可用数据较少的地域发扬感化。我们还公布在全球范畴内推出新的模子Google Flood Hub,能够展现洪水可能发作的时间和地点。我们将把它带到Google Search和Maps上,以搀扶帮助更多的人在发作水灾时能抵达平安的处所。

图注:挪动端洪水揣测系统

最初,AI 正在为资本不敷的地域供给更多的医疗保健办事。例如,我们正在研究 AI 若何搀扶帮助读取和阐发低成本超声设备的输出成果,为准父母们供给他们所需的信息,以便在孕期能更早地发现问题。我们还方案陆续与护理人员和公共卫生气构协做,通过我们的主动视网膜疾病评估东西(ARDA)来扩展糖尿病视网膜病变筛查的时机。通过ARDA,我们已经在印度、泰国、德国、美国和英国等国度摆设利用和前瞻性研究中,胜利筛查了超越15万名患者,此中一半以上是在2022年。此外,我们还在摸索AI若何通过用户的手机检测唤吸和心率。那项工做是Google Health更普遍的愿景 — “让任何拥有智妙手机的人都能更随便获得医疗保健”的一部门。

将来的AI

我们在神经收集架构、机器进修算法和利用于机器进修的硬件新办法方面获得的停顿,搀扶帮助AI为数十亿人处理了重要的现实问题。更多的停顿即将到来。我们今天禀享的是对将来充满期看的愿景:AI正让我们从头想象手艺若何可以带来搀扶帮助。我们期看,在我们摸索那些新才能并操纵那项手艺改进世界各地人们的生活时,你会与我们一路。

0
回帖

Google Jeff Dean: 通过三种方式,AI 正在全球扩展为有益人类的技术 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息