人工智能应用了什么技术_人工智能技术有哪些应用

企业需要了解图像识别、语音识别、聊天机器人、自然语言生成和情感分析如何改变他们的业务运营方式。

人工智能技术正在将自己融入商业的方方面面。一些重要的人工智能技术包括图像识别、语音识别、聊天机器人、自然语言生成和情感分析。

需要明确的是,每种类型的人工智能技术都代表了广泛的类别,通常包括几十个甚至上百个基本组件。反过来,这些组件通常被重组为更复杂的应用程序,从而为企业创造价值。

例如,百货公司的人工智能机器人可以在工作中使用图像识别、文章和语音识别技术。图像识别软件将使其能够检查货架上存货的位置、价格和数量;文章将帮助他们避开任何障碍,并确定他们在商店中的位置;语音识别组件将使其能够引导和娱乐客户。

为了实现这一成就,这些业务中的人工智能技术通常会结合各种算法和技术,为整个任务的特定部分量身定制。它们包括符号处理、统计分析、神经网络等。

以下是对五种人工智能技术的深入阐述,这些技术随着时间的推移而发展,从而极大地改变了企业处理、分析和生成数据的方式。

1.图像识别

企业使用图像识别的各种方式包括:对工厂生产线进行自动检查,在保险中生成损害估计,识别图像中的对象,统计人员,控制制造过程,检测客户进入商店等事件,以及生成真实世界的模型。

人工智能技术必须找到一种方法,用各种人工智能算法可以处理的数字来描述世界。在视觉方面,研究人员发现了如何将一张图片划分成像素网格,这样每个像素就可以用一个数字来表示。早期是用一个数字来描述每个像素的亮度。后来,人们发现可以用三个或更多的数字来描述每个像素中不同颜色的亮度。

20世纪60年代,研究人员开始探索如何利用原始光学字符识别(OCR)技术的软件图像识别功能来识别数字文档中的字符。其他研究人员开始探索基于图像的场景判读技术,试图从二维图像重建三维图像。多年来,这些技术已经成为机器视觉行业工具包的一部分。

后来,研究人员发现,图像识别可以被组织为一个分层的过程,以便更容易解释日益复杂的现象。例如,黑白像素可以被识别为直线和曲线,而直线和波浪被识别为数字的一部分。训练算法学习如何根据这些曲线图案而不是每个像素的亮度来解释字符要容易得多。同样,根据图像中是否包含两只形状合适的眼睛和耳朵,而不是每个像素中颜色的原始亮度,更容易确定图像是否为猫。

这种处理方法有望推动图像识别领域的发展。然而,直到2012年左右,随着AlexNet(一种旨在支持图像识别的八层卷积神经网络)的发展,研究人员才发现如何扩展这一过程,以识别数千种不同类型的物体。

AlexNet等深度学习技术的优势在于,模型可以自动学习以不需要人类以编程方式指定每一步的方式执行各种图像识别任务。研究人员指出了如何将神经网络应用于不同类型的问题,这一功能也促进了深度学习在其他类型应用中的使用。

现在,图像识别被用于识别产品中的人、货架上的图片或文章、生产线上的缺陷以及自动驾驶汽车在街上遇到的物体。随着冠状病毒疫情的出现,许多企业正在开发应用程序来监控社交距离的规则。

商业领袖的一个关键见解是,通过在应用中使用多种类型的图像识别,通常可以创造更多价值。例如,智能文档处理和文档智能结合了一套人工智能技术,包括自然语言处理和机器学习,以难以识别的格式捕获和分类数据。结合光学字符识别(OCR),智能文档处理可以分析文档的视觉布局,以确定哪个部分代表产品、发票金额或销售条款,并将这些信息提供给其他业务应用程序。

值得注意的是,企业中的大部分图像识别应用都是高度场景化的。供应商和研究人员经常推广新的图像识别改进,例如在识别肿瘤方面击败医学专家的软件。但在实践中,只有在合适的角度拍摄图像时,人工智能才能使用一套特殊的设备来处理这些辐射图像,而人类擅长分析从许多不同角度拍摄的各种图像。

研究人员还发现,在这些图像识别应用的一些实现中存在隐藏的偏见。为了减少偏见,专家建议用数据来训练这些应用程序,这些数据代表了要处理的特定类型的图像。

2.语音识别

需要许多算法来将语音转换成文本,并为数字处理做准备。尽管语音识别系统越来越好,但即使是最好的语音识别系统也仍然容易出错,因此在安全关键的应用中(如医疗数据采集)需要进行一些验证。

1952年,贝尔实验室的研究人员开发了第一个用于识别单个数字的语音识别系统。到1962年,IBM推出了鞋盒机,可以理解16个单词。到了20世纪80年代中期,研究人员开始使用统计技术(如隐马尔可夫模型)开发可以理解2万个单词的应用程序,但单词之间会有停顿。第一款消费听写产品Dragon Dictate发布于1990年,可以根据语音自动打字。随后,ATT公司推出了一款语音识别应用,无需人工操作即可接通电话。这些早期的系统或者具有适用于特定环境的小词汇量,并且需要单个语音的大量训练。

自2010年以来,研究人员发现了将深度神经网络应用于语音识别的方法。这种增长的主要驱动力之一是需要找到一种更好的方法来表现不同类型的智能扬声器的声音特性。这就需要探索一种更好的方法,将原始的音频数据转换成人类习惯听的独特声音(称为音素)(例如“汽车”一词中的“c”)。

研究人员还将基本的语音识别结果与更好的场景结合起来,以区分同音异义词(bear/bare)。云计算服务现在提供各种核心的语音到文本服务,然后开发人员将这些服务集成到各种企业工作流中。

通过云计算服务(如微软Cortana、Google Now和苹果Siri)将基本的语音识别功能嵌入到现代智能手机和电脑中。亚马逊利用语音识别技术推出了一种通过Alexa语音服务在智能手机之外连接互联网的新方式。这些服务通常在云平台中做繁重的工作。最近,谷歌通过开发更有效的算法来提高其标准,这些算法可以在其Pixel手机上本地运行语音识别应用程序。

语音识别技术在企业中的使用越来越多。一些供应商也开始开发自动记录电话会议和现场会议的应用程序,以达到合规目的或更好地记录决策过程。自动语音识别还可以帮助监控呼叫中心的活动,以确保员工遵循正确的程序,这样经理就不必听到每个呼叫。语音识别应用程序也被用于为国际旅行者自动翻译语言。这种人工智能技术的其他商业应用包括家庭自动化、文章游戏交互和用于索引文章的自动隐藏字幕。

3.聊天机器人

对话式人工智能技术允许应用程序以自然的方式与人类进行交互。第一个聊天机器人Eliza于1964年至1966年在麻省理工学院人工智能实验室开发。最早的聊天机器人在词汇和允许的交互类型方面受到限制。这些应用程序使用决策树,决策树根据查询或用户对问题的回答沿着不同的路径运行。在20世纪80年代和90年代,这些技术被扩展到自动电话应用,其中通过使用拨号音或IVR技术的简单词汇来控制交互。

最近,由于用于解释和响应文本查询的更好的自然语言处理技术以及与其他服务的更好集成,企业更容易自动设置可以响应常见问题的聊天机器人,聊天机器人的应用激增,接受命令或定制对给定用户的响应。最近,对聊天机器人应用的一个关键见解是开发一个应用程序编程框架,用于表达用户的意图和适当的响应。

面向外部的聊天机器人可以帮助客户互动的许多方面实现自动化。它们还允许公司通过各种社交媒体渠道,如脸书,以更具吸引力的方式进行推广。

企业的应用程序开发和部署已经看到了使用聊天机器人技术的爆炸式增长,该技术将聊天机器人与可以自动配置应用程序和基础设施并生成报告的操作工具相结合。聊天机器人集成使团队能够记录他们的流程,以便更容易处理重复出现的问题或确定特定流程在过去是如何执行的。

聊天机器人工具已经开始进入商业的其他方面,以帮助记录部门内部或部门之间的各种通信,尤其是越来越多的公司采用Slack和微软Teams等消息应用程序。财务部门可以使用聊天机器人来生成和跟踪重要业务指标的状态。销售团队可以使用聊天机器人来收集关键客户的数据。

聊天机器人还可以帮助促进其他类型的内部互动。例如,员工可能会要求人力资源聊天机器人询问他们的福利状况或要求休假。企业还使用聊天机器人来自动化与IT系统管理的交互,以处理简单的问题或自动分类更复杂的问题。

4.自然语言的产生

随着数据量的增长,可能很难为员工或客户确定正确的信息优先级。自然语言生成(NLG)应用程序可以帮助为给定用户找到、组织和总结最合适的见解。

根据不同的业务用例,这种人工智能技术有不同的风格。自然语言生成开始作为商业智能和分析应用程序的前端,作为Gartner创建的新应用程序类别的一部分。这些技术结合了解释纯文本查询和生成纯英语分析的适当摘要的能力。例如,美国国家航空航天局(USAA)建立了一个自然语言生成(NLG)应用程序,以改进它向商业用户提供的关于不同保险产品销售的答案。

这种人工智能技术的另一个特点是改进了向用户展示产品信息的方式。在这些类型的应用中,自然语言生成引擎可以根据用户的偏好定制产品描述。例如,可以向更多的技术用户介绍新手机耳机等产品的技术特征,同时向注重时尚的买家提供关于其外观和感觉的美学描述。自然语言生成(NLG)也可以帮助改进将内容翻译到新市场的方式。

Trulia正在使用自然语言生成(NLG)来自动生成房地产列表的社区描述。自然语言生成(NLG)也用于为美联社制作基本的新闻文章。《Esquire Singapore》甚至精心制作了一期特刊,里面有人工智能应用的故事。然而,这种人工智能技术仍处于初级阶段,专家提醒企业和医疗及其他关键任务应用程序,需要新的质量控制。

尽管如此,企业仍然可以从自然语言处理框架的最新改进中受益。新的自然语言处理指标正在出现,以帮助企业评估给定框架的效用,并改进自然语言生成(NLG)应用程序的这些实现。

5.情感分析

人们在撰写关于事件、品牌、政治家和其他事物的文章时,通常会表达不同的情感类型和强度。情感分析领域始于20世纪50年代,当时营销人员分析书面文件的语气。但这是一个非常手工的过程。然而,现在几乎每个人都在社交媒体、博客、新闻评论、评论、支持论坛和与公司的通信中留下了情绪化的数字痕迹。

各种人工智能技术,包括自然语言处理、机器学习和统计学,被用来分析这些数字足迹的情感基调。这些工具有助于跟踪产品或服务的变化如何影响客户,而无需直接询问他人。这也有助于密切关注竞争对手的产品和活动。

情感分析的另一个用例可以识别所谓的品牌影响者,以便企业和个人可以建立更强的关系,并且他们可以就如何改进服务或产品提供更好的建议。

情感分析还可以帮助识别客户或潜在客户可能感兴趣的事物的重要趋势,以便企业改进其现有产品或创造新产品来满足这些需求。企业还可以利用情感分析来确定自己品牌可能受损的具体原因,比如等待时间长、质量差或者构思差。

企业也在业务中使用这种人工智能技术来帮助了解和提高员工的士气和福利。在这个用例中,情绪分析可以分析员工的职位,以帮助理解重要的问题或管理者的变化对他们可能产生的影响。

更复杂的情绪分析应用使用人工智能来理解声音和面部表情传达的情绪。这种分析可以帮助识别支持电话中的情绪变化,或者评估客户对商店货架上新产品的看法。网飞甚至试图用面部表情的情感分析来改进电影预告片。然而,一些研究人员警告说,情感分析的这些应用可能会受到可靠性、特异性和普遍性的影响。