人工智能商业内参 004

「人工智能商业内参」旨在梳理当下人工智能商业化进程中的创新机会和变革契机,每周一、三、五出街。

Apple Music 是人工智能驱动的产品吗?

苹果在去年推出 Apple Music 时曾公开表示自己对于算法驱动的音乐推荐服务的鄙视,虽然苹果没有直说,但业内人士都能意识到所指的公司就是 Spotify 和 Pandora(当然,现在的 Pandora 现在早已不是Apple Music 的对手),而在 Steven Levy 探访苹果公司的人工智能之后,Levy 也开始困惑,人工智能到底在Apple Music 里扮演了怎样的角色

more

……Cue says, Apple recommendations depend on a combo of humanity and machine — flesh-and-blood music editors whose selections are mixed with algorithmic results, increasingly honed by machine learning. “I don’t think machine learning will get some of the human curation things that we want for a long, long time, if ever for that matter,” he says. “But there are a bunch of things we can’t humanly curate because we don’t have enough people. Like we can’t humanly curate all of your music, for example.”


Google 在机器学习上有哪些应用

「机器之心」介绍了Google 公司在机器学习应用方面的各种尝试,其中云视觉是一个极容易被忽视却应该放长远来看的:

谷歌云视觉 API 是一项更有技术含量和企业化的产品,通过将强大的机器学习模型封装在易操作的 REST API 中,它使得开发人员能够使用 API 理解图像的含义。它可以把图像快速划分到成千上万种类别中,还能识别图像中的物体和人脸、读出图像中的印刷文字。作为一个开发者,你可以在图像目录里建立元数据、控制冒犯性的内容、或者通过情绪分析制定新的营销方案。


人工智能与云计算

我曾多次表示:人工智能要给云计算带来不一样的变化。The AI-First Cloud: Can artificial intelligence power the next generation of cloud computing? 里谈到:

Cloud Machine Learning (ML) Platforms: Technologies like Azure Machine Learning, AWS Machine Learning and the upcoming Google Cloud Machine Learning enable the creation of machine learning models using a specific technology. However, excepting Google Cloud ML that leverages TensorFlow, most cloud ML technologies don’t allow the execution of AI programs written in mainstream AI or deep learning frameworks like Theano, Torch, TensorFlow, Caffe, etc.

AI Cloud Services: Technologies like IBM Watson, Microsoft Cognitive Services, Google Cloud Vision or Natural Language APIs enable abstract complex AI or cognitive computing capabilities via simple API calls. This model allows applications to incorporate AI capabilities without having to invest in sophisticated AI infrastructures.


人工智能如何压缩图片

Google 相册一直是我最喜欢的服务之一,如果你在上传照片时勾选了「高品质」,那么就可以获得相册的无限空间使用权,这里其实就涉及到了图像压缩。Google 想借助人工智能进一步优化图像压缩的大小与质量之间的关系

根据论文,Google 首先需要让人工智能系统进行有效学习。为此,他们使用了 600 万张随机压缩的 1280×720 图片,并分别把每张图分成若干 32×32 像素的小块。之后,人工智能会在其中挑选出 100 个压缩率最不理想的小块进行学习。

经过对这最难压缩的 100 个小块进行学习,Google 希望可以提升人工智能压缩最复杂数据的能力,从而让人工智能在压缩普通图片时更加游刃有余。

经过大量学习之后,类神经网络通过复杂的运算可以将图像解构,将图像分成若干小块,并且针对每块的实际情况“对症下药”,采取量身定制的压缩方案,而不是使用统一方法压缩整个图像。

由此,人工智能可以在压缩前预先估计采用不同方案后的压缩效果,经过一系列复杂的计算选出最佳方法。

由此一来,它既有效缩减了文件大小,也没有让质量打折过多,而且论文显示,这项技术目前已经在标准测试上优于 JPEG 格式。


人工智能诊断忧郁症

来自哈佛大学和佛蒙特大学的研究者开发了一款机器学习程序,其判断Instagram用户是否患有忧郁症的准确率可达到70%。而之前的研究表明,医生对患者是否患有忧郁症的正确诊断率只有42%。

研究者在论文中称,他们的程序分析了166个Instagram账号的43950张照片。程序利用所谓“marker”来鉴别Instagram用户是否有忧郁症,分析的内容包括色彩、元数据、和脸部识别。研究还发现,患有抑郁症的Instagram用户一般不喜欢使用滤镜,但如果他们用的话,他们倾向于使用“Inkwell”滤镜。"


百度继续发力语音识别

Solidot 报道了 百度的语音识别软件的新进展

根据百度和斯坦福大学进行的一项研究,人类在打字速度上输给了语音识别软件。百度首席科学家吴恩达称,言语是更自然的人类交流方式。在研究中,百度的Deep Speech 2 语音识别软件与32名年龄在19到32岁的人类测试者测试了在iPhone上的英语和汉字输入,结果语音输入的速度是人类打字的三倍。在英语测试中,Deep Speech 2的错误率比人类低20.4%;在汉字测试中,软件的错误率比人类低63.4%。斯坦福的计算机科学家James Landay对结果感到意外,他希望这些发现能鼓励人们去重新考虑对着手机说话的主意。


Google 继续为无人驾驶招兵买马

这篇腾讯科技的报道称:谷歌又招新高管 或加大无人驾驶汽车项目开发力度

2004年以来,一直担任Airbnb公司负责短期房屋租赁业务的全球主管沙恩·斯图亚特(Shaun Stewart)如今却加盟谷歌,担任谷歌无人驾驶汽车项目的主管。斯图亚特此番加盟谷歌,主要是接替两周之前刚刚从谷歌突然离职的技术主管克里斯·乌尔姆森(Chris Urmson)。

路透社最新报道了谷歌招聘无人驾驶汽车项目新高管的消息。目前,谷歌汽车团队的一位代表也证实了这一消息。

在新的工作岗位上,斯图亚特将向前现代汽车公司美国公司负责人、现任谷歌无人驾驶汽车项目首席执行官约翰·克拉夫茨克(John Krafcik)直接汇报工作。如今,谷歌也在积极准备将该公司多年来一直经营的项目转化成最终可推向市场的产品。2015年,克拉夫茨克开始出任谷歌无人驾驶汽车项目的首席执行官。