AI 硬件产品经理需要懂的技术有哪些?本文作者就这个问题进行了思考并总结,与大家分享。
目录:
- 计算机硬件(计算/输入/输出/交互)
- 计算机软件(系统/算法)
- 懂技术的概念与构建技术知识体系
完整的计算机系统是由硬件(hardware)和软件(software)两大部分(即两类资源)组成的。
计算机的硬件系统是计算机系统中看得见、摸得着的物理设备,是一种高度复杂的、由多种电子线路及精密机械装置等构成的、能自动并且高速地完成数据计算与处理的装置或者工具。
计算机的软件系统是计算机系统中的程序和相关数据,包括完成计算机资源管理、方便用户使用的系统软件和完成用户预期处理的应用软件这样两大部分。
硬件与软件二者相互依存,分工协作,缺一不可,硬件是计算机软件运行的物质基础,软件则为硬件完成预期功能提供智力支持。
下面以我做过的无人机为例,分解一下需要哪些方面的技术能力,做一个简单的认知。
01 计算机硬件
如上图,大疆的无人机包含两部分,飞机和遥控器。
遥控器对于飞机来讲,属于输入设备。类似于我们电脑的键盘鼠标。
我们先不讨论遥控器,只看飞机部分。(见下图)
图中 GPS、前视/下视/后视视觉系统、红外感知系统,这些都是传感器,属于输入装置。
电机属于输出装置,有的也叫做动作器,根据输出命令做出相应的反应。
机头 LED 指示灯、飞行器状态指示灯、对频状态指示灯、对频按键以及电池上的电源开关,电量指示灯。这些属于人机交互部分。
还有一部分我们从外观上看不见的。处于机体内部的处理器、储存器、图像 sensor 等。
所以,一个智能设备与我们的计算机组成一模一样,输入—>计算—>输出。
计算机组成
以前推荐过一本书《计算机组成原理》。
以我们人类来举例,耳鼻眼口(传感器,获取并输入),眼观四路,耳听八方,获取周边环境信息;传输到大脑(计算);手脚(动作器,输出)。
1.1 硬件的计算部分
了解这一部分有什么好处?
- 我们 PM 需要了解智能设备的工作原理,才知道怎么设计一款产品。
- 功能及流程的权衡取舍,比如我们同时需要做人脸识别和视频数据传输,需要考虑硬件资源开销的问题。产品规划的权衡取舍,比如产品在软件上的迭代考虑是否预留资源。
- 成本评估,我们自己根据需求设计的产品,更够较为准确的做成本预估,选择什么样的处理器、多大的ROM/RAM 等。
- 开发周期的评估,换了一个硬件平台,运行于其上的大部分软件/算法基本不能复用,基本上算法重新开发。
更重要的是,我们明白这部分内容,跟软件、算法、硬件团队沟通的时候会快速简单很多,别人不需要跟你解释太多。比如硬件团队在做原理图设计的时候需要芯片的数据手册、设计指南等,需要传感器的规格、接口定义,芯片支持列表等等。
产品前期沟通的时候,能够快速找到对应的相关人,发现问题,定位问题,拉取相关的人员进行简短沟通以提高产品人自身的效率。
懂一些这部分内容的优势是当我们更加深入了解这一块儿内容的时候,我们做的产品竞争力可能更加不一样。
经常关注新的硬件平台,可以增加产品在性能、成本上的优势。
科技创新是需求创造的基础。可能我们以前解决不了的问题,在新的硬件平台可能轻松解决了。
产品经理经常拓展这些资源,有利于赋能我们创造产品。
1.2 硬件的输入部分
我们经常讲,AI 重要的三驾马车,算法、算力、数据。
AI 硬件设备,一部分数据是事先准备好的用于训练设备的智能。另一部分是从外部实时获取的。这部分来源就是我们设备上的传感器。
数据输入的质量决定了我们设备输出效果的好坏。类似于我们读了很多的鸡汤文章,但是没办法做好自己的工作,这部分鸡汤文章属于无效数据。
我们根据产品功能设计和场景选用不同的传感器,甚至传感器组合来实现一项功能。因为不同传感器适用不同环境、具备不同功能和效果边界。
上例中的无人机,一个定位功能,气压计可以提供高度信息,但是这个高度信息只是海拔高度,并且受温度影响,俗称“温漂”。这就造成了使用场景和数据精度的局限。
- 爬坡地貌:随着坡度上升,海拔高度变化极小,很容造成撞击山坡。这时候你可以使用超声波辅助定位。
- 室内环境:室内无 GPS,如果需要精确定位,使无人机不漂移,就需要配合下视视觉传感器配合。
简单列举上面两点环境说明传感器的适用边界。
再看一下传感器的功能和效果边界。
超声波可以实现高度测量,但是有测量极限,并且某些材质对超声波具有吸收特性。
视觉传感器效果不错,但是易受环境光影响,同时也对透明玻璃失效,也存在视觉盲区。视觉传感器主要原理是抓取物体特征进行计算,环境光影响类似于拿手电筒照射我们的眼睛,使我们什么都看不到。
传感器的类别特别多,有距离(激光雷达/超声波雷达/深度摄像头)、烟雾气体、触控、动作、光线、加速度和角度测量(IMU)、身份识别、声音等等。
有无数的传感器都能够检测你能得到的任何事物。因此没办法一一列举,只能靠我们平常的积累和项目实战。通过广泛的涉猎获知广袤的传感器功能与效果边界;通过项目实战明白其中的奥妙。
之前推荐过一本书《传感器实战全攻略》,有兴趣,动手能力强可以亲自实现一下,也可以作为一个传感器入门教材。
AIOT 实现的前提就是我们能够运用传感器获取到我们需要的数据,然后才能通过 AI 去处理,实现智能化。
1.3 硬件的输出部分
其实这部分分为人机交互和动作执行两部分。为什么呢?
比如 LED 指示灯、显示屏这些既有通过计算处理给出的状态结果也有给人类的交互。
我自己是将执行动作的部分定义为输出,比如无人机的电机。将指示灯、显示屏、蜂鸣器等定义为人机交互。主题思想是执行动作的为输出,给人类反馈的是交互。
这里主要讲执行动作。交互部分单独作为一个小主题。
无人机执行动作的有两部分,一个是螺旋桨下面的电机,一个是云台相机部分的电机。
螺旋桨部分的电机,控制各电机的转速以产生不同升力,从而控制无人机的航向。电机有不同的类型,比如无刷电机,空心杯电机。玩具无人机以及一些儿童玩具汽车都用空心杯。消费级、工业用无人机多用无刷电机。
为什么要单独讲这个呢?
因为不同的智能设备其如果有动作器,其动作器的类型不一样,比如优必选机器人上的那些关节是舵机。
我们需要根据不同的应用环境和产品效用选择最适合的动作输出部件。扩大、提高产品的效用边界。
1.4 硬件的交互部分
我自己将交互分为人机交互和互联网数据交互两部分。
人机交互:即人与设备的交互,使用人对设备的控制和设备给使用人的直观状态反馈。
互联网数据交互:既然是 AI 硬件产品,必定有数据产生或者联网等。将数据传送到云端处理或者转发到 App 端。
先看人机交互部分:
无人机例子中的交互包含了指示灯、按键这些。
产品经理需要知道在何种场景下使用何种指示灯,做出那些指示反馈的交互,也就是我们常说的用户体验。
用不同的颜色、不同的闪烁等级表示飞机的状态,比如红色灯快速闪烁,表示飞机没电了,给人一种强烈的刺激,告诉机主需要快速停止操作并返航。
我们需要知道 LED 有三色灯,也有单色灯,可以多种颜色组合使用。LED 还可以做成灯带,灯带能做成什么样比较漂亮,进而提升产品的美观度。
按键,可以复用以节省成本、使外观更加美观,比如 iPhone 就一个 home 键搞定一切,特别的简单。按键还可以长按、短按、长按+短按组合使用,实现不同的功能,比如短按显示电量,短按+长按开关机;也可以与其他按键组合实现另一项功能。
mic 阵列,在智能音箱上 mic 阵列的重要性比较高,什么样的mic 收音效果怎么样,最好是 360 度都能唤醒音箱对吧!了解各类 mic 的特性,大小、灵敏度、信噪比、最大输入声压等。
数据交互部分:
目前无人机的数据是通过 App 传到云端服务器,不太直观。稍微提一下,一般无人机下发到 App 端的数据是通过 5.8G 信号,也有不少采用 WiFi 传输。然后 App 通过移动互联互联网或者家里的路由器上传到云端。
这里面还有一些设计机制会导致用户体验问题,比较复杂暂且不表。
我们用比较常见的产品来举例,以求直观的认知体验。
我们的无线耳机采用蓝牙与手机或者电脑进行数据交互;
我们的智能手机采用WiFi/4G模块与对应的服务器进行数据交互。
没错!产品经理需要了解的数据交互就是这部分。
产品经理需要了解这些组网方式的优缺点,适用环境。
以常见的 WiFi 为例:
智能手机,直接在屏幕上输入密码即可使手机入网。一是用户习惯已经形成,二是基本也算是傻瓜式。并且智能手机也在迭代,比如小米手机直接分享二维码即可使另外一台手机入网。
假设我们终端是 wifi 入网,那我们是 2.4G&5G 两个频段都是支持吗?两个频段有不同的特性,成本也不一样。假如不这支持 2.4G,其实很多用户家里的路由器是不支持 5G 频段的。
我们 AI 硬件产品可能没有屏幕,需要考虑用户如何傻瓜式的入网。在入网方式方面,我们提供 AP 模式让用户通过 App 告诉终端 WiFi 的名称和密码,还是通过蓝牙的方式,或通过摄像头扫码的方式。
如果不了解 wifi,就不知道 WiFi 有 AP 模式和 station 模式,也不知道怎么设计入网方式是最符合用户的认知及习惯。
所以,根据我们产品的适用环境,考虑功耗、速率、续航、传输距离、延时及联网耗时、成本等,关注其用户体验。
产品经理视角还是关注于用户、场景,因此关于计算机硬件重点关注输入与输出部分,这两部分与用户强相关。
计算部分深度参与到软硬件讨论中即可,花大量时间将这个学会对于产品经理来讲有点儿浪费时间。
参与工程实践过程中我认为是一个不错的学习方式,重点关注技术动态,以帮助我们优化产品的性能与成本,以及提供更好的解决方案。
02 计算机软件
若进一步深入分析计算机系统,我们可以通过 6 个层次来认识计算机硬件和软件系统的组成关系(如图)。
最下面的两层属于硬件内容,最上面的3层属于软件内容,中间的指令系统层连接硬件和软件两部分,与两部分都有密切关系。
2.1 操作系统
产品经理不需要完整了解这里面的全部,关注一下操作系统这一层级即可。我们经常接触的就是「操作系统」,对这个相对比较清楚,有一点儿认知。例如手机的操作系统 Android/iOS 等;电脑操作系统 windows/Mac os 等。
我们设计的功能基本是在这一层之上实现的。我们不需要在这一层面有过多的了解,当然如果懂一些更好,方便与工程师之间顺畅的沟通。
需要明确的是,最后联调通过,找工程师拿到引导装载程序(bootloader)以及固件(系统及应用软件,通常是打包好的,但也有分层的)给到工厂 NPI 或者其他负责生产的人员进行成品软件烧录。
2.2 人工智能技术(算法)
这层叫做应用软件也好,还是算法也好,我们不在这些专业名词上做过多的纠结。
我们重点关注能够实现我们既定的目标,以用户需求侧为导向引导技术研发;提高决策水平和沟通能力。
理解人工智能技术什么能做,什么不能做;什么容易做,什么不容易做;什么该做,什么不该做。确保需求的可行性,实现方案的模块拆解,评估工作量,以产品/业务的角度协助研发人员以保证系统架构的合理性。
懂技术并不是说我们能够实际的工程实践,当然如果能够做简单的工程实践更好,因为能够帮助我们更好的理解人工智能技术。工程实践是算法工程师的工作,并不是产品经理的工作。
AI 产品经理需要在技术广度上发挥力量;算法型产品经理或者算法工程师在技术深度上发挥力量。
理解目前主要的人工智能技术,机器学习、深度学习;计算机视觉、语音交互(ASR/NLP/对话管理/自然语言生成/TTS)、Vslam、知识图谱等。
03 技术的概念与知识体系构建
AI 硬件产品经理懂技术的概念概括为:
- 技术赋能产品创新,掌握前沿技术在所处领域的应用和实践;
- 融入到实际的研发过程中,设计交互体验(或叫用户的使用体验),协调人工智能三要素“算法、算力、数据”;
- 从对手或者目前技术层面横向比较产品优劣势,对内外宣传价值。
构建技术知识体系:
- 人工智能三驾马车“算法、算力、数据”;
- 硬件资源,传感器和组网(其实也是传感器);
- 人机交互语言(灯带、按键等)。
只有懂,才知道软硬件效用与边界,才能更好的运用。
最后,从技术、成本与性能上理解,软件和硬件在逻辑上是等效的,即某些操作有软件实现,反之亦然。按照摩尔定律来讲,组成计算机的基本元器件的发展,其性能不断提高,价格不断下降。某些软件操作由硬件去完成,即软件硬化,同时也提高了实际的运行速度。所以这是一个动态平衡的过程,取决于我们产品经理的决策。
作者:Arvinzhou,微信号:zf519678391;公众号:AI 硬件产品官(ID:AIPM001)欢迎关注我,期待与您交流