-->
获得免费通行证,加入我们的流媒体连接-2月19日至22日; 现在注册!

为Alexa和她的朋友设计视频体验

文章特色图片

为Alexa和她的朋友设计视频播放听起来可能是一项晦涩难懂的任务, 这与成功视频发行商的核心要求相去甚远, 但实际上,这是一个非常聪明的解决大搜索问题的方法. 观众现在有很多视频服务可供选择, 很难找到有问题视频的服务, 开发人员发现创建一个优雅的, 用户界面(UI)的高效导航.

解决搜索问题

语音控制允许用户通过语音导航,而不是通过图形用户界面, 其结果是,用户不必考虑如何找到他们的内容. “语音遥控是让UI扁平化的好方法. 它提供了一种很棒的体验,并且是一种访问令人眼花缭乱的内容选择的方式,Jonathan Palmatier说, 产品管理副总裁, 语音控制, 康卡斯特有线电视. 康卡斯特的X1电视机顶盒有一个语音遥控器, 这个发明可能会让人们不再讨厌他们的有线电视公司(至少如果他们的公司是康卡斯特)。.

音频控制只是故事的一部分. 当与AI(人工智能)配对时, 软件应该能够学习观众的喜好, 调到正确的频道或服务, 并随着时间的推移提供越来越合适的搜索结果和推荐. 所以在未来, 告诉设备, “播放我最喜欢的电视节目”应该做到这一点——但我们在这里有点超前了. 通往音频控制的道路可能是漫长而曲折的. 剧中的角色包括亚马逊的Alexa, 苹果的Siri, 以及微软的小娜, 以及谷歌助手和康卡斯特的X1.

- vs附近. 远场通信

X1和任何你能与之通话的遥控器都使用近场通信, 在有限距离内设备的一种短距离连接标准. Alexa(通过亚马逊Echo)和其他永远在线的设备使用远场通信. “(远场设备)一直处于开启状态,等待关键字唤醒,然后开始录制和传输语音命令. 我们的语音遥控器(X1)只有在用户按下麦克风时才能工作。.

语音远程搜索和通过远场人工智能平台播放内容之间的区别可能很小, 移动线. 亚马逊的Fire电视遥控器支持Alexa功能,可以像Echo设备上的Alexa一样做出反应, 但绝大多数Alexa控制都是针对音频和联网家庭设备的. 现在可用的一个视频播放控制是Plex, 如果在家庭媒体设置中有Plex服务器,Alexa可以播放Plex内容.

许多语音平台都可以很好地处理自己的内容(例如.e.例如,Alexa最适合亚马逊的内容),或者使用语音遥控器播放电影. 当观众想要从其他媒体源或应用程序中寻找内容时,问题就出现了, 或者提出更复杂的要求. 媒体应用程序需要设计语音控制,以便从人工智能平台提供的音频导航中受益.

对于本文, 亚马逊发来了书面声明,我在这里进行了浓缩, 可以添加通过“技能”显示卡片控制. 正是这些“技能”使活动成为可能——连接NPR技能意味着Alexa可以访问NPR应用程序的内容,并提供音频新闻简报(摘要)。. 没有连接技能, Alexa会返回很多“我不明白这个问题”的回答. Siri也有类似的问题. (记者无法联系到微软和Roku的联系人接受采访.)

“Alexa,打开我的电视,播放今晚的新闻”的日子还很遥远. “当你使用Alexa或其他远场设备时,你可能离它很远. 这大大增加了设备的智能,以减轻任何环境噪音,帕尔玛提尔说. 任何试图让远场设备在大量噪音中识别命令的人都能体会到这一点, 在某些方面, 近场似乎是一个更容易解决的问题.

主题和. 查询。

除了被分为近场通信技术和远场通信技术, 还有两种不同类型的语音识别方法, 第一个是面向主题的语音识别,比如Xfinity的解决方案, Mark Vena说, 前全球营销副总裁, 吊索的媒体 和EchoStar. 以主题为导向的查询,如“给我看乔治·克鲁尼的电影”或“查找当前的本地新闻”,似乎是一个更容易的提议.

然后,语音识别设备使用基于查询的解决方案来处理更多开放式问题. 如果你问谷歌助手:“好吧,谷歌,今晚Sling TV播什么??,谷歌打开了吊索的媒体网站. 人工智能角色可以让你更接近内容, 但在许多情况下,发布内容可能仍然需要几次点击.

吊索的媒体没有语音控制选项, 但这是Vena个人非常感兴趣的话题, 所以, 似乎, 还有很多人. 在2017年1月的CES上, 似乎每个人都在宣传自己的设备支持alexa, 亚马逊自己也在会议空间外展示了一个巨大的步入式Echo模型. 如果不出意外的话,亚马逊在推出Alexa方面做得非常出色. 亚马逊表示,有成千上万的开发人员正在为Alexa开发技能.

你的比例是多少??

基于查询的系统应该从用户特定的搜索中生成更广泛的数据. 这有关系吗?? 当它告诉你你看过A的时候, B, 和C, 加上搜索过的X, Y, 和Z, 你可能会喜欢这样那样的内容. 亚马逊在其推荐引擎上建立了一整套业务, 使其成为一种有吸引力的方式来分发更多的内容.

在一个非常基本的层面上, 甚至在尝试确定观众可能对什么内容感兴趣之前, 最初的问题需要一个准确的答案. 提供只有50%正确率的信息是可以接受的吗? 在理论上, Alexa和她的朋友们来自这所聪明的学校,并且从这些大公司可以提供给他们的所有百家乐软件中受益. 实际上,这些语音控制系统通常就像小孩子学习如何说话一样聪明. Alexa volunteered that she’s 2 in human years; Apple TV’s Siri says, “我觉得我昨天就被冷落了.“当我们与他们交谈时,他们的答案是正确的,我们印象深刻. 当他们不这样做的时候,我们对他们的想法就不那么好了.

我们对“播放儿童电影”的不科学测试在Xbox One上得到了意想不到的结果, Roku的语音界面在搜索结果中返回成人和暴力电影. The Cortana interface with Xbox One didn’t tap into its movies app; instead, 它显示了在线搜索的电影和YouTube视频. 所有这些界面在回答更具体的问题时似乎都表现得更好. 系统智能的发展还需要一段时间, 不管系统是使用基于查询还是基于主题的搜索.

UI设计难题

“在许多拥有深度内容库的界面中,最大的挑战之一就是你无法找到自己真正喜欢的内容,Tjeerd Hoek说, 创意副总裁 青蛙设计. 该公司以帮助许多财富500强公司进行产品和用户设计而闻名, 包括为各种视频提供商开发接口. Hoek面临的挑战是如何以一种用户可以在尽可能少的步骤中轻松导航的方式显示内容库. “你看到或听到的事情就那么多, 因此你甚至不会搜索[不同的内容]. 搜索媒体是一个很好的例子,通过声音来完成比给人们一个搜索框和左边的一些过滤器来找到一首歌要好得多, 或者是他们心目中的电影.”

现代 绿野仙踪

很多年前Hoek在微软工作的时候, 这家巨头正在测试用户对语音导航的反应. “我们会把人叫进来,让他们跟电脑说话,”霍克说. “我们有一个人(在另一个房间)控制电脑 绿野仙踪.

今天的系统将向导整合到操作系统中,并使用自然语言处理器(NLP),因此用户可以用日常英语提问. “(康卡斯特)在构建我们自己的NLP方面投入了大量资金,因为我们相信这是整个系统的战略组成部分, 因为魔力来自于能够调整它. 你不只是从查询中生成通用的答案,”Palmatier说. 对于使用者来说,日常英语很容易. 对于媒体公司的开发者来说,这是一个棘手的问题.

发展规划

“在为语音驱动的环境开发时, 确保你拥有传统的应用内部曝光度和深度链接策略,迈克尔·戴尔说。, 工程副总裁 Ellation. 接下来的目标是各自的语音控制软件开发工具包(sdk). Dale表示,这些都映射到各自平台上的标准行为. “将视频添加到iOS应用程序的监视列表中很容易与Siri工具包集成. 通过Chromecast在电视上播放你最喜欢的节目可能是通过Google Actions最容易实现的.”

流媒体覆盖
免费的
合资格订户
现在就订阅 最新一期 过去的问题
相关文章

SME 2018:嘿,谷歌,OTT的下一步是什么?

消费者发现浏览实时线性内容本身就是一种奖励, 而谷歌助手正着手让用户体验更愉快、更高效, 谷歌的雷切尔·伯克在2018东流媒体大会的闭幕主题演讲中表示.

在Conviva的帮助下,HBO使用AI来对抗缓冲

Conviva表示,只有通过智能实时检测才能实现高质量的互联网流, HBO正在使用Conviva的新视频人工智能平台,通过HBO GO和HBO NOW实现这一目标

即将推出的亚马逊Fire TV棒将包括Alexa语音辅助

Fire TV Stick With Alexa Voice Remote的售价为39美元.99美元,增加了语音辅助功能,可以查找电影、查看天气和订购披萨.

Apple TV获得简单认证和Siri语音控制

在一个以软件为主的WWDC主题演讲中, 苹果宣布了对Apple TV tvOS的几项改进, 但支持4K视频的硬件却不见踪影.

Roku更新Roku 3与语音搜索,Roku 2与更快的引擎

除了, Roku机顶盒用户将获得更新的软件,包括频道搜索和追踪新电影的方式.

SXSW报道:语音和手势将控制未来的电视

很快,消费者将能够在任何设备上获取他们想要的任何内容. 为了支持这一点,电视需要变得更容易控制.

提及的公司及供应商