SmartCow 的新开发套件,使开发人员能够创建具有对话式 AI 功能的应用程序

需要加强对话式 AI和基于视频的应用程序开发的企业可能想了解SmartCow.ai,这是一家专门从事视频分析和使用容器进行部署的 AIoT 设备的 AI 工程公司。 

SmartCow 的新开发套件,使开发人员能够创建具有对话式 AI 功能的应用程序

物联网 ( AIoT ) 是一个新命名的 IT 类别。它将人工智能 (AI) 与物联网(IoT) 基础设施相结合,以表面上实现更高效的物联网运营、改善人机交互并增强数据管理和分析。

这家拥有六年历史的公司本周推出了新的视听开发套件 Apollo。围绕 Nvidia Jetson Xavier NX 处理器构建的 Apollo 设备使开发人员能够创建具有对话式 AI 功能的应用程序,首席执行官兼创始人是Ravi Kiran。

“传统的开发工具包面向初学者级开发人员,他们使用人工智能视觉在应用程序中广泛使用的通用用例,”Kiran 说。“我们认识到开发人员的广度和深度,他们想要一个开发工具包,使他们能够更深入地研究和开发,包括实现对话式 AI 和 NLP(自然语言处理)的能力。

“Apollo 是一个专门的开发工具包,旨在满足更高级别的开发人员的需求,并为他们提供直接使用更多会话应用程序的方法。这些解决方案使用 Nvidia SDK 构建并打包在 Docker 容器中,并部署在 Apollo 上。这使开发人员/客户可以尝试各种解决方案,而不必担心安装库等等,”Kiran 说。

阿波罗直立在桌子上

SmartCow 的Apollo 开发套件直立在您的办公桌上,并配备板载视觉和音频传感器,包括四个麦克风、两个扬声器端子、两个 3.5 毫米电话插孔、一个 8MP IMX179 摄像头模块和一个 OLED 显示器。此外,Apollo 配备 128GB NVMe SSD 用于存储,并预装了 Nvidia DeepStream 和 RIVA Embedded SDK 工具包。SixNLP 示例展示了该套件的独特功能,包括:与文本无关的说话人识别系统;语音转文本和情感分析;语言翻译和说话者分类;以及异常声音和监视的应用。 

说话人分类是根据说话人身份将输入音频流划分为同质段的过程。

Apollo 开发套件支持两个可编程按钮:一个是默认的一键恢复功能,可帮助开发人员简化设备恢复过程,另一个是可编程按钮,为开发人员添加应用程序提供灵活性,为他们提供更便捷的开发方式。Kiran 说,Apollo 设计有一个底座,可以直立,使其更易于使用。 

预计全球NLP市场将从 2021 年的 209.8 亿美元增长到 2028 年的 1272.6 亿美元,在预测期内以 29.4% 的复合年增长率 (CAGR) 增长。凭借六个入门 NLP 示例和无缝、即时的说话人识别,Kiran 声称 Apollo 满足了对使用高级 AI 模型同时处理音频和视频数据的开发套件日益增长的需求。 

人工智能的实施

为了让技术人员、数据架构师和软件开发人员更多地了解如何利用人工智能,IamCIO 向 SmartCows 首席执行官 Ravi Kiran 提出了以下问题,他向读者提供了这些细节:

IamCIO:您具体使用哪些 AI 和 ML 工具? 

Kiran:   DeepStream 用于视觉,RIVA 用于音频;这些是由 Nvidia 制造的 SDK 工具包。SmartCow 工程团队拥有最重要的专业知识。

IamCIO:您是否使用开箱即用的模型和算法——来自 exaPEle、DataRobot 或其他来源? 

Kiran: SmartCow 拥有大量数据,因此我们可以训练自己的模型。我们的合作伙伴公司也提供这些模型。 

IamCIO:你主要使用什么云服务? 

基兰: AWS。

IamCIO:你是否使用了很多云附带的 AI 工作流工具? 

Kiran: SmartCow 开发的权重和偏差以及内部工具。这些工具不断发展。 

IamCIO:你自己做了多少? 

Kiran:大部分工程都是在内部完成的。

IamCIO:您如何为 ML 和 AI 工作流程标记数据? 

Kiran:通过迁移学习等技术,任务的训练模型需要更少的数据;当需要标记数据时,我们会使用外部服务。

IamCIO:你能给我们大致估计一下你正在处理多少数据吗? 

Kiran:这取决于任务。我们经常从公共来源获取数据。也有提供数据的商业公司。在某些情况下,我们会在边缘安装传感器并构建复杂的管道来检索所需的数据。

本文为作者 黄凯 独立观点,并不代表 我是CIO 立场。

发表评论

登录后才能评论