2004年,SoundHound的首席执行官兼联合创始人Keyvan Mohajer坐在斯坦福大学的宿舍里,他设想了这样一个世界:人们可以和周围的事物交谈,而事物也会回应他们。作为一名徒步旅行者和连续创业者,他一直在寻找下一个需要解决的大问题,并从企业号星际飞船的甲板上寻找灵感。
“我是一个科幻迷,我意识到有很多很酷的概念还没有被开发出来,”他告诉我。“当时有一种可以传送到任何地点的远程传送技术,蓝冠注册AI正在通过自然语言处理来帮助驱动各种形式的机器人,以帮助人类。例如,机器人可以用来将饮料运送到酒店房间,或将比萨饼运送到房屋,同时让接收者提出问题以获取信息。有一种可以把任何房间变成任何环境的全息技术,还有一种可以制造食物或设备等任何东西的复制器。”但最引人注目的是人工智能语音。我知道20年后这将成为我们的现实。”
很少有投资者愿意冒险尝试一个20年的计划来推动这个聊天的世界,所以他和同学们一起启动了这家公司,推出了一款音乐发现应用,这款应用后来成为了Shazam最大的竞争对手,下载量超过3亿次。2005年,SoundHound从谷歌退休高管、Felicis的艾丁•森库特(Aydin Senkut)那里拿到了第一笔外部投资者支票,2006年,SoundHound完成了首轮融资。
如今,SoundHound是一个系列D独角兽,它能让物联网说话。我有机会在人工智能的语音状态,它的新兴意识,以及与泰坦竞争的感觉上赶上Mohajer。以下是经过编辑的谈话记录。
谷歌,苹果和亚马逊都有自己的世界观。他们希望他们的助理无处不在,他们希望人们说出他们的名字,“嘿,谷歌”,“嘿,Alexa”,“嘿,Siri”。
但是想象二三十年后,当100亿人生活在200亿机器人中间,有些是医生,有些是律师,有些是教师。它们都应该叫Alexa吗?
这不是品牌想要的。品牌希望顾客说出自己的名字。“嘿奔驰。”“嘿,本田。“我们的平台允许这种个性化。
我们的使命是给万物带来声音AI——汽车、厨房电器、智能音箱,酒店客房,这套,手机,电脑,和权力的一些最受欢迎的品牌在世界上包括雪铁龙、德国电信、三星|哈曼,这里技术、本田、现代、起亚、梅赛德斯-奔驰、摩托罗拉、潘多拉,标致。
你会说你的人工智能比谷歌、Alexa和Siri更聪明吗?
是的,我们的技术是先进的。我们使用语音到意思(而不是语音到文本到意思),这使我们的物联网对话更快、更有上下文关联。我们也使用深层意义理解,它能够处理任意长度的复杂句子,具有复合标准和多重排除。这与标准的NLU(自然语言理解)不同,后者使用硬编码的“实体检测”,只能理解简单的查询,蓝冠注册mmWave技术在城市中效果很好,您可以在建筑物的顶部放置一个小型单元,并为整个街区服务。在密集的城市环境中,建筑物通常是障碍物。如“给我看看旧金山的寿司店”。
人们对人工智能理解复杂问题和与助手进行简短、简单、基于关键字的查询的能力的期望很低,但不应该是这样。电脑比人类更擅长计算。有了我们的技术,用户可以像人一样与他们的汽车交谈,并在不同的理解领域提出多个问题。例如,“嘿,梅赛德斯,给我看看旧金山晚上9点以后还营业的五星级寿司店,但不包括那些没有wifi的寿司店,如果下雨的话请告诉我。”
你的人工智能能感知情绪和情绪吗?
我们正在努力。为了与设备对话,我们与他人对话的方式需要同时包含智能和情感两部分。
电影《她》有多少会变成现实?
在不久的将来,会有很多智能设备,它们将成为我们日常生活的一部分。我们会对着闹钟、咖啡机、汽车说话,在工作中我们会对着电脑和设备说话,然后我们会回家对着电视说话。人工智能将无处不在,带着情感元素,假以时日,人们将接受它作为自己的存在。
当我第一次看到电影《她》(Her)时,我的团队正在为我们的平台编程,以便进行反驳。我们想知道答案是否应该是“这是我找到的”,还是“这是一些餐馆”。
整个行业在哲学上存在深刻的分歧。当苹果让Siri听起来像人一样时,谷歌避免说“我”。
我发现这部电影传达的信息非常有力量,蓝冠官网设计了该套件来支持亚马逊基于云的AVS。它允许蓝冠代理人员对连接到AWS IoT Core的语音控制设备进行原型设计,该设备是Amazon托管的云服务,用于与蓝冠测速云应用程序和其他设备安全地交互。它让我相信这个东西是存在的,值得用“我”来称呼自己——这在今天很常见。
为了清楚起见,对这段对话进行了编辑和浓缩。