文章将grasp分类为Power Grasp和Precision Grasp,指出灵巧手很好的适配power grasp,但在precision grasp上应用夹爪多于灵巧手。并设计了一个可在power grasp与precision grasp两者间切换的系统。

文章的主要贡献点是针对灵巧手精确抓取的姿态优化方法和手部指尖几何优化方法,分别用于构建演示数据、遥操控制,和构建指尖装配件。

引言

给出了Grasp的一种分类方法的定义

  • Power Grasp:用手掌和手指抓取。现有研究包括从仿真中学习策略,用点云作为观测以支持sim2real;用VR设备收集遥操数据。
  • Precision Grasp:用拇指和另一个手指夹取。现有方法多关注设计更适合的硬件平台,和引入触觉等传感器。

多指灵巧手很适合power grasp,更多的接触点提供了更好的稳定性,适用于较大物体;夹爪则足以胜任precision grasp的精确接触点,并完成叠衣、安装插头这类任务,适用于较小物体和较薄物体。本文设计了在统一的控制策略和硬件平台上,无需重新设计灵巧手即可完成两种grasp的方法。

引言介绍的创新点:

  • 针对precision grasp,简化成拇指和食指平行的动作;
  • 通过neural switcher,根据物体在power grasp和precision grasp间切换;
  • 通过从仿真中蒸馏得到的neural physics surrogate physics model,优化控制量和手指的几何,完成手部指尖的设计。

相关工作

  • 前文所述Power Grasp和Precision Grasp的相关方法
  • 计算设计和联合设计
    以往的机械设计计算方法通常利用基于梯度的优化以及针对几何或拓扑的任务感知规划,计算量大且泛化差。而可微仿真器通过在统一框架内实现形态与控制的联合优化,解决了这一问题。该文章使用后者,并将指尖的几何建模为接触平面。
  • 模仿学习
    通过演示学习策略。本文应用遥操作数据进行real2real验证,应用仿真中优化得到的数据进行sim2real验证。

方法

整体是模仿学习框架,演示数据包含观测和动作 D = ( O , A ) D=(O,A) D=(O,A),通过优化方法构建演示数据训练策略 π \pi π

控制

在仿真中得到数据的方法是,先通过力闭合的目标进行优化,再应用运动规划,并结合仿真筛选。对大的物体进行power grasp,对tiny, thin物体进行precision grasp。

仿真数据

在这里插入图片描述

  • Grasp Pose Optimization
    对于power grasp,通过优化force closure目标得到演示数据;
    对于precision grasp,固定食指和拇指以外的自由度,给定物体网格 O O O和关节配置 q q q,在拇指和食指分别采样n个接触,每个接触包含空间点的位置 x i ∈ R 3 x_i \in \R^3 xiR3和法向量 c i ∈ R 3 c_i\in\R^3 ciR3,定义 [ x i ] × [x_i]_\times [xi]× x i x_i xi的反对称矩阵(skew symmetric matrix),grasp map G = [ I 3 . . . I 3 [ x 1 ] × . . . [ x 2 n ] × ] G=\begin{bmatrix}I_3&...&I_3\\ [x_1]_\times&...&[x_{2n}]_\times\end{bmatrix} G=[I3[x1]×......I3[x2n]×] c = [ c 1 T   c 2 T   . . .   c 2 n T ] T c=[c_1^T\ c_2^T\ ...\ c_{2n}^T]^T c=[c1T c2T ... c2nT]T,最小化目标函数 E p = ∣ ∣ G c ∣ ∣ 2 E_p=||Gc||_2 Ep=∣∣Gc2,来得到使得net wrench接近0的抓取姿态。
    注:反对称矩阵A满足 A T = − A A^T=-A AT=A
    向量 x = [ x 1 , x 2 , x 3 ] T x=[x_1, x_2, x_3]^T x=[x1,x2,x3]T的反对称矩阵 [ x ] × = [ 0 − a 3 a 2 a 3 0 − a 1 − a 2 a 1 0 ] [x]_\times=\begin{bmatrix}0&-a_3&a_2\\a_3&0&-a_1\\-a_2&a_1&0\end{bmatrix} [x]×= 0a3a2a30a1a2a10 ,这样定义是为了便于表征向量叉乘, [ a ] × b = a × b [a]_\times b=a\times b [a]×b=a×b
    这里的假设应当是所有接触点都有相同大小的力, G c = [ c 1 + c 2 + . . . + c 2 n [ x 1 ] × c 1 + [ x 2 ] × c 2 + . . . + [ x 2 n ] × c 2 n ] Gc=\begin{bmatrix}c_1+c_2+...+c_{2n} \\ [x_1]_\times c_1+[x_2]_\times c_2 +... +[x_{2n}]_\times c_{2n} \end{bmatrix} Gc=[c1+c2+...+c2n[x1]×c1+[x2]×c2+...+[x2n]×c2n],矩阵中的两项分别是 合力 和 合力矩。
  • Pre-Grasp & Overshoot-Grasp
    对于power grasp,参照Dex1B和DexGraspNet的方法,基于物体SDF将手指推向物体表面得到pre和overshoot grasp;
    在precision grasp采用平行夹爪动作,定义 d d d为从拇指接触点到食指接触点归一化后的方向向量,pre-grasp时拇指和食指要移开一小段距离 α \alpha α,需要的关节速度通过Jacobian pseudo-inverse J † J^\dagger J应用逆运动学方法计算得到 Δ q t h u m b = − α J t h u m b † d \Delta q_{thumb}=-\alpha J^\dagger_{thumb}d Δqthumb=αJthumbd Δ q i n d e x = α J i n d e x † d \Delta q_{index}=\alpha J^\dagger_{index}d Δqindex=αJindexd
  • 模型和仿真配置
    使用ManiSkill仿真,power grasp和precision grasp分别训练一个DexSimple策略,并用PointNet根据物体分类,选择Power Grasp/Precision Grasp,并将仿真中得到的策略直接部署至真机实验。

真实数据

实验设置包含两类grasp的组合任务和纯precision grasp任务,通过遥操作收集数据。
问题:基于位置的重定向在夹取螺母这类精确夹取任务上效果不好
方法:两个模式,普通retarget 和 pinch控制器。通过目标函数 E p r e c i s e = ∣ ∣ G c ∣ ∣ 2 E_{precise}=||Gc||_2 Eprecise=∣∣Gc2优化手部姿态,此处c表示食指和拇指间的接触法向,而非手物间的接触法向,并使用和仿真数据中同样的平行夹爪动作, Δ q = J † d \Delta q = J^\dagger d Δq=Jd。并使用遥操数据训练ACT策略

指尖优化

在这里插入图片描述
这部分的目标是优化指尖几何来使灵巧手能更有效完成precision grasp。
通过优化,构建一个接触平面来进行precision grasp。
用平面点 p p p 和平面单位法向 n n n 来表征接触平面P。
优化 P P P和关节位置 q q q,最小化设计的三个能量项。

  • geometric
    从空间点位置的角度设计。包含吸引项 E a t t E_{att} Eatt,和惩罚手指表面点跨越平面P的排斥项 E r e p E_{rep} Erep
    。下式中 x i x_i xi表示手指contact点, d ( ⋅ , P ) d(\cdot, P) d(,P)表示点到平面P的距离, ϕ P ( ⋅ ) \phi_P(\cdot) ϕP()表示点到平面P的带符号距离, [ ⋅ ] [\cdot] []为指示函数, S ( F ) S(F) S(F)为手指网格的表面点云。 E a t t = ∑ i = 1 N d ( x i , P ) , E r e p = ∑ v ∈ S ( F ) [ ϕ P ( v ) < 0 ] d ( v , P ) E_{att}=\sum_{i=1}^Nd(x_i, P), E_{rep} = \sum_{v\in S(F)}[\phi_P(v)\lt0]d(v, P) Eatt=i=1Nd(xi,P),Erep=vS(F)[ϕP(v)<0]d(v,P)
  • manipulability
    从平行夹爪操作能力的角度设计的能量项,使得平面满足手指能沿平面法向方向平行移动。 E m a n i = − ( ∣ ∣ J t h u m b n ∣ ∣ 2 + ∣ ∣ J i n d e x n ∣ ∣ 2 ) E_{mani}=-(||J_{thumb}n||_2+||J_{index}n||_2) Emani=(∣∣Jthumbn2+∣∣Jindexn2)
  • neural physics
    用其他项优化得到的参数进行仿真得到的数据训练PointNet+MLP得到的代理模型估算任务成功率,输入为平面参数P,关节角度q,物体点云o f : ( P , q , o ) → s ^ , s ^ ∈ [ 0 , 1 ] f:(P,q,o)\to \hat s, \hat s\in[0, 1] f:(P,q,o)s^,s^[0,1]
    设计能量项 E p h y s = − f ( P , q , o ) E_{phys}=-f(P,q,o) Ephys=f(P,q,o)

注:机器人的雅可比矩阵是末端执行器速度和关节速度之间的线性关系,末端执行器速度 V V V,关节角度 q q q,关节速度 q ′ q' q,关节角度 q q q下的雅可比矩阵 J ( q ) J(q) J(q),满足 V = J ( q ) q ′ V=J(q)q' V=J(q)q,将关节空间速度映射到直角坐标空间。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐