技术上遥遥领先的特斯拉,让我看到了自动驾驶作为卖点的未来。
AIDay3个小时的直播里,其中半个小时只有音乐没有画面。当然,这是特斯拉,这是马斯克,发布会迟到这种事情,我们也预料到了。
而后面的两个半小时,都是关于FSD、Dojo以及TeslaBot机器人和深度Q&A的内容。
如果一定要问我其中记住了什么,我心里好像只有一个栩栩如生的画面。在AIDay直播开始后的2小时53分处,马斯克风骚地撩开夹克并回应记者的提问,说道:
IfyouwearaT-shirtwithastopsign,thecarwillstop.
他说的意思就是,如果你穿着下面这种指令停车的路牌的衣服,特斯拉也会识别成真实的路牌并且停车。
从这句话里,结合最近的某品牌的车祸和AIDay的演讲内容,我总结了两个含义。
现阶段所有市面上普通人能买来开上路的「自动驾驶」其实都是辅助驾驶。自己的命只能自己负责,这一点不能忘。
人脑强在语义信息的识别,而电脑强在精确且重复的计算和目标跟踪。
01特斯拉的车机里,居然有个元宇宙?
想必大部分的朋友们已经知道,特斯拉现在采用的是纯视觉感知方案。只依靠8个130万像素摄像头的感知能力,确实提升到了一个新的境界。传统的感知算法是把这8个摄像头的里的每一帧图片中的相关物体逐个画上边框,来评估距离信息并依此输出规控结果。
但是目前全新的FSDbeta采用了叫做「VectorSpace(矢量空间)」的技术,相当于通过把8个视频流中缝合成一个整体,并生成一个统一的物理模型作为路线规划的基础。如果要我说人话,就是特斯拉在车里做了一个可以模拟现实环境的沙盘,然后在这里面推演它的操作。
VectorSpace是4D的。所谓4D就是长宽高三个维度的立体信息加上时间。所以,这个沙盘是一个立体且有时间线的模型,远比传统的2D感知来的信息量和精度都高。
特斯拉AI总监AndrejKarpathy说:
Wearedevelopingasyntheticanimalfromthegroundup.
其实这就是「自动化」和「智能化」的区别。FSD想要做的就是脱离对特定画面因素有特定的反应的死模式,而是通过对整体空间和里面的物体的把握来做更符合「上下文」的判断。通过对时空的记忆,特斯拉FSD除了可以记住并预测被遮挡的行人,也可以更好地动态改变自己的绕行路线。
02智能驾驶的三个目标
说实话,AIDay的很多内容,对于我这种只想看最终结果的人来说,没太看懂。不过我发现他们对于自动驾驶的研发目标,其实也是体验驱动的。
按照第一性原理,车子的本质就是一个交通让人从A点到达B点的交通工具。而一个合格的搭载自动驾驶交通工具,还需要在确保能到达的基础上,优化效率、舒适性和安全性。
说人话就是,特斯拉想让你的旅途又快又稳又放心,也就是「顺滑」。
本次AIDay的规控部分由毕业于自动驾驶名门院校——美国卡内基梅隆大学的特斯拉自动驾驶元老级人物,也是AP的软件负责人AshokElluswamy担任主讲。
03顺滑的行车来自合理的规划
Elluswamy说,路径规划的挑战有两个——非凸和高维度。
非凸就是下图中在右侧的函数,有多个局部极值,而不是像左边的凸函数那样只有一个极值。
这样的问题就适合用DiscreteSearch(离散优化)而不是ContinuousFunctionOptimization「连续优化」。前者类似带数字,而后者可以理解为用微分的方式找到极值。如果使用微分方程来解上图中右边的非凸函数,则有可能得出错误的答案。
高维度就意味着这个问题拥有许多参数,和非凸问题相反,它更适合连续优化。
其实每当遇到这些决策的时候,特斯拉可以在1.5毫秒内做出2,500次推演。相比人脑,这种场景对于电脑来说,其实都是静止的。
上图中,车辆需要在下一个路口左转前完成两次连续的向左变道。如果选择插入到相近的两台车之间,急促的刹车不可避免。但是如果为了避免车辆而加速到最前方,又会面临错过路口的风险。FSD可以从图里的右侧的多个解答(每一根线都对应不同的动作指令)中选择加速度(和舒适性有关)较为稳定且路径(和效率有关)较短的结果来执行。
04为别人考虑
我们都不喜欢起冲突,其实机器也是。因为冲突意味着至少有一方会受到伤害,两败俱伤也不是少数。效率上的损失大到交通事故,小到交通堵塞。其实都是都是因为有大大小小的冲突导致的。
上图中的道路是一个居民区的双向车道,但是由于过多的路边停车导致局部道路只有一辆车的宽度。如果你是一个喜欢侥幸的司机,你可能会希望对方的车避让你;如果你是一个保守的司机,你可能会在空旷的位置停下,让对方先行。但是无论如何,你都需要预判对方的动作来给自己的决策做参考。不然你停在那里死等对方,对方也停在那里死等你,对于双方都非常保守的自动驾驶系统来说,这样就会陷入死循环。
这个时候,特斯拉的FSD算法其实会跟人一样,根据车速,加速度以及角速度和角加速度等因素判断对向来车的路径(绿色代表
