苹果罕见参加CES年展却不发产品上次参加还是1992年

[PConline 资讯]12月10日,据外媒报道,苹果竟罕见的参加消费类电子技术年展CES展会,要知道,苹果上一次参加还是在1992年。CES是目前世界上最大、影响最为广泛的消费类电子技术年展,举办地是美国拉斯维加斯。有趣的是,别人家去CES都是展示自家最好的产品,而苹果这次参加却不展示新品也不发新品,而是为了讨论其在消费者隐私问题上的立场。

苹果今年将委派隐私高级总监 Jane Horvath 出席 CES 的一个圆桌活动,和来自 Facebook、P&G 以及联邦贸易委员会专员讨论公司是如何规模化建设隐私服务和管制等方面话题。

常常学校里的男学员一堂课后都汗流浃背,金佑琪更是练到肌肉无力,胳膊疼痛,手臂几度都痛到抬不起来。

放入新鲜香菜末蒜苗花儿

Masakhane项目的合作对象包括非洲各地的人工智能研究人员、数据科学家,旨在创建能够沟通非洲大多数人口的神经机器翻译。在Deep Learning Indaba(与人工智能和深度学习有关的会议)和Sauti Yetu NLP Unconference之后,南非的Jade Abbott和Laura Martinus发起了Masakhane这一项目,在祖鲁语中,“Masakhane”是“我们共同建设”的意思。

是有着一头卷发、皮肤黝黑

只要非洲语言的机器翻译足够普及且准确,就能让更多非洲人与全球人在线交流,还有可能快速地将英文的教学资源转换成非洲语言。多项研究发现,当人们以母语接受教学时,他们会学得更好。

撒上白片萝卜和酱香牛肉块

笑容灿烂的尼日利亚女硕士

在一次集体采访中,Masakhane项目的志愿者表示机器翻译能给非洲的发展带来巨大的好处。

本月早些时候,作为人工智能促进发展工作的一部分,Siminyu与数据科学网站Zindi共同发起了“非洲语言数据集搜集挑战”项目。除了Siminyu和Abbott,评估数据集的顾问还来自于谷歌人工智能和Facebook人工智能研究。活动的参与者制作的数据集将来可能会被用于训练Masakhane的神经模型。

他曾进过一次肯尼亚的酒吧和夜总会,人们伴着音乐跳着舞,但是他却听不懂背景音乐是什么意思。

“拉面师傅就是个魔术师啊!”

到底兰州牛肉拉面有多好吃,街头巷尾都是拉面店,还让这么多非洲朋友安利?

还记得这块广告牌吗?这就是去年苹果在CES展会期间在拉斯维加斯包下大广告牌宣传自己的隐私服务。

受访者来自非洲大陆的各个角落,包括突尼斯、尼日利亚、南非和刚果民主共和国等,他们希望能将非洲纳入全球人工智能地图,让非洲人可以非洲方式解决非洲问题。

在金佑琪看来,最难学的就是溜面。经过揉抻后,握住面条的两端,抬起在案板上用力摔打。面条拉长后,两端对折,继续握住两端摔打,如此反复近十遍。

多年来,许多国际人工智能的会议都在欧洲、亚洲以及北美举办。虽然该行业以及各国对人工智能的人才需求量很高,但是有些政府往往会拒绝非洲研究人员加入项目研究,即使他们接受的也是西方国家的教育。

据悉,三地药监部门将统一在医药新产业、新业态、新技术、新模式下的审评、注册、监管等标准,共同研究信用等级评价体系,共同出台互查互评监督检查细则等制度,共建许可审查员、检查员队伍,强化事中事后监管和跨区域联合执法检查。

比如,和面要求“三遍水,三遍灰,九九八十一遍揉”;溜面则是将面团反复捣、揉、抻、摔,保证面条劲道,更有嚼劲;拉面时更要掌握力道,两臂用力加速向外抻拉。“总之非常费力气,花功夫。”

在案件查办联动机制方面,将建立京津冀快速反应、协同应对的药品、医疗器械和化妆品突发事件应急处置协作机制,成立三地协查小组,严惩跨区域违法犯罪行为。

例如,在Masakhane项目发起不久后,他们参加了国际计算语言协会,从Jehovah’s Witness的文本中发现了380种语言的JW300数据集。

柔韧爽滑的兰州牛肉拉面制作完成

作为拉面小白,最初操作中,金佑琪常常一头雾水。

Masakhane的工作将分阶段进行,首先是借助政府文件或报纸等公开数据将英语翻译成非洲语言。接着,他们打算为机器翻译创建单独的基准模型。最后,再将成果提交给全球顶级的自然语言处理(NLP)讨论会。

看似做法简单的拉面,要拉成功,其实有很多细节需要注意。

就在这周,Mozilla和德国政府部门启动了一个开源项目,收集非洲当地语言的语音数据。

据报道,就当世界上最大的人工智能研讨会NeurIPS在温哥华举办之际,包括Masakhane志愿者在内的非洲和亚洲研究人员,都收到了加拿大政府拒绝发放签证的通知。

做出这碗地道拉面的拉面师

像MySQL、Python和TensorFlow这样的开源项目为现代互联网和机器学习等蓬勃发展的学科研究奠定了基础。如今,欧洲、亚洲和北美等地在开源项目的研究上仍处于领先地位。但是,一旦Masakhane及类似的项目取得成功,这可能会为有着地球上人口最年轻的非洲大陆以及其他地区带来重大改变。

在娱乐方面,Murhabazi希望像Masakhane这样的项目能够将歌曲的歌词翻译成英语,让每个喜欢音乐的人都能理解歌词。

大学期间对中国文化产生了浓厚的兴趣,专程去尼日利亚的孔子学院报名学习汉语。2016年成为兰州大学汉语国际教育专业的研究生。

金佑琪,今年25岁,是一名硕士研究生。

其中,来自肯尼亚卢希亚部落的Kathleen Siminyu曾是内罗比(肯尼亚首都)“女性机器学习和数据科学”组织的联合创始人,同时也是“人工智能促进发展”项目的协调员。因为肯尼亚的学校和全国各地都说英语,可同时肯尼亚各个部落又有不同的语言,这就导致了Siminyu和她的邻居之间的沟通障碍。因此今年早些时候,为了增强社区凝聚力,Siminyu选择加入了Masakhane。

在Abbott看来,和来自全球那些参与语言资源少的语言研究工作者进行交流,真的可以激发起他自己的研究兴趣。

初到兰州,当地的非洲朋友纷纷告诉她。“来兰州最重要的事,就是吃碗地道的牛肉拉面。”

不过,热爱中国文化的她,最喜欢的成语就是——持之以恒。

“好多次坐车回学校的路上我都睡着了,睁开眼,坐过站啦。”现在回想起学习的过程,金佑琪露出热情爽朗的笑容。“当时真是太很难了。”

一向颇有主见的金佑琪没有被吓退,反倒激起了要当一名女拉面师的斗志。

原来,看似小小面团,内涵乾坤。

Masakhane与跨国翻译组织和学者一起搜集语言数据集。除了将非洲本土语言翻译成英语外,该项目还试图对尼日利亚的洋泾浜英语和北非及中非地区的阿拉伯语等方言进行翻译。

Siminyu表示,她希望研究网络可以在非洲良好地运作。在她看来,语言作为人们的沟通障碍,一旦能将其克服,许多非洲人就能够参与到数字经济中去,并最终进入人工智能经济领域。一直以来,Siminyu都在为非洲的本土语言发展而努力,她觉得自己有责任把还未进入数字时代的非洲同胞们带入人工智能时代。

Masakhane项目仍处于早期阶段,正在寻找志愿者,收集上千种语言的数据。

从GitHub的2019年Octoverse报告来看,肯尼亚和尼日利亚等国家已经成为全球开源项目增长最快的国家。最近几周,非洲技术和开发者生态系统的增长吸引了包括Twitter首席执行官杰克·多西和GitHub首席执行官Nat Friedman在内的众多硅谷高管来非访问,特别是尼日利亚的拉各斯等非洲部分地区。

刚果民主共和国的Espoir Murhabazi目前主要研究班图语Lingaga。他想更好地理解班图语,以及了解机器学习是如何从包含共同词根的单词中推断出含义的。班图语属于黏着语,这也就意味着它的单词可能包含词干含义和多个要素。班图语的研究能为Masakhane目前在研究语言之间的结构差异时遇到的一系列技术挑战提供一定的参考。

图为拉面师傅展示面型。史静静摄

2018年,Abbott和Martinus在arXiv上发表的《针对非洲语言的神经机器翻译》在NeurIPS的发展中国家机器学习会议进行了分享。他们详细地讲述了早期将Transformer(一种神经网络)应用于资源少的语言时的发现。通过一系列技术的运用,实现了英语到班图族的茨瓦纳语的最顶尖翻译。

真香这件事儿,谁也躲不过。

在加入肉汤和调料后,金佑琪终于端到一碗心心念念的“一清(汤)二白(萝卜)三红(辣子)四绿(香菜蒜苗)五黄(面条黄亮)”的兰州牛肉拉面。

当时还不太会用筷子的金佑琪,费劲的用筷子搅着面条送进嘴里,喝上鲜香醇厚的肉汤, “delicious”边吃边为拉面师傅竖起大拇指,这面吃起来太过瘾啦!

其实,在通过让非洲人收集数据使得更多其他非洲人能够使用机器翻译的道路上,Masakhane并不孤独。

在信息共享方面,将完善信息共享和风险交流机制,三地定期通报药品、医疗器械和化妆品检验监测,不良反应,不良事件等信息,实现区域监管信息和数据共享。

对于Abbott和Martinus来说,能到非洲以外的其他地方参加人工智能交流(比如NeurIPS)能为他们的研究带来许多帮助。在这些重要的会议上,其他的NPL开发人员会分享100多个他们在试图优化模型性能的时候发现的技巧以及总结出的观点和经验。

作为一个“吃货”,金佑琪尝过很多的面食。但是和牛肉面“一面之缘”后,她被满口留香的兰州美食征服,萌生了学做拉面的想法。

推广:猎云银企贷,专注企业债权融资服务。比银行更懂你,比你更懂银行,详情咨询微信:zhangbiner870616,目前仅开通京津冀地区服务。

摆在金佑琪面前的,除了胳膊酸痛,拉面面型也是一大难题。兰州牛肉拉面有毛细、二细、二柱子、大宽、荞麦棱等十几种面型。

这几年越来越摸不着苹果的节奏了,让我们看看这次苹果能在隐私方面搞什么大新闻。

今年早些时候,Masakhane成员制定的基于五种南非语言的基准在意大利佛罗伦萨的计算语言协会(ACL)会议上首次亮相。

Abbott表示,该项目现在处于数据收集和翻译阶段,因为与构成现代互联网主干的欧洲语言不同,非洲语言缺乏基准和大型数据集。

负责约鲁巴语的尼日利亚研究人员Olabiyi Samuel表示,他们可以解决他们的问题,而且他们有着足够的专业知识,只是需要对其承担一些责任。

非洲、人工智能与世界

Siminyu认为,机器学习的语言翻译将会带来非洲人工智能应用的逐渐普及,让非洲人民能够借助人工智能更好地改善生活。而像Masakhane这样的项目,对于连接非洲地区的开发人员和研究人员并同时建立长期合作来说,是相当重要的。

Masakhane的参与者们不仅希望能将非洲人民带入数字经济,能用他们自己的语言学习知识,还希望这个由非洲人自己创建的人工智能项目能够减少一直以来非洲人工智能研究人员面临的技术限制。

在为非洲语言创建了机器翻译之后,Masakhane还希望能有更多开源项目来造福非洲人民。

Siminyu表示,非洲还有很多问题亟待解决,比如农业问题、粮食问题、气候变化、医疗保健等等,而这一切的切入点就是语言。解决非洲问题,任重而道远。

抱着好奇,她前往学校附近的一个小面馆。当看到拉面师傅将手中的一疙瘩的面溜、揉、扯、抻,极富变化,瞬间拉出宽如皮带、细如发丝的不同形状面条。

为了实现当拉面师的梦想,金佑琪坚持利用课后空闲去拜师学艺。每天下课后,顶着烈日,坐17站公交站,一路摇晃到终点站,继续步行20多分钟,赶到拉面学校。

可是,金佑琪发现,拉面的师傅一般都是膀圆力大的男性。

她辗转找到一家专业的拉面学校。学校校长梁顺俭告诉金佑琪,仅仅是拉面的准备工作就很讲究。

Siminyu和其他项目参与者希望Masakhane能为后续更多研究项目打下基础,让人工智能更好地改善非洲人民的生活以及其他非常重要的环节。

金佑琪来中国前,心里既忐忑又好奇。中国是什么样的?兰州有好吃的吗?能适应当地的生活吗?

Masakhane现在统计了来自非洲大陆的大约60名参与者,其中最活跃的来自南非、肯尼亚和尼日利亚。每个参与者都被要求用各自的母语帮助收集数据,改善模型。

图为金佑琪品尝拉面。受访者提供

他们正在研究的数据集范围是两万个平行句,在机器翻译领域中已经是很小的范围了。而在这个JW300数据集中,同一语言有100万个平行句,在数量上可以说是一个巨大的飞跃。

图为学习拉面的过程。史静静摄