• 您的位置:首頁 > 新聞動態(tài) > Unity3D

    Unity3D 骨骼動畫原理小記

    2019/2/14??????點擊:
    一、骨骼動畫、關(guān)節(jié)動畫、關(guān)鍵幀動畫


      在實際的游戲中,用得較多的是這三種基本的動畫。

      在關(guān)鍵幀動畫中,模型在每個關(guān)鍵幀中都是一個固定的姿勢,相當(dāng)于一個“快照”,通過在不同的關(guān)鍵幀中進行插值平滑計算,可以得到一個較為流暢的動畫表現(xiàn)。關(guān)鍵幀動畫的一個優(yōu)勢是只需要做插值計算,相對于其他的動畫計算量很小,但是劣勢也比較明顯,基于固定的“快照”進行插值計算,表現(xiàn)大大被限制,同時插值如果不夠平滑容易出現(xiàn)尖刺等現(xiàn)象。

      關(guān)節(jié)動畫是早期出現(xiàn)的一種動畫,在這種動畫中,模型整體不是一個Mesh, 而是分為多個Mesh,通過父子的關(guān)系進行組織,這樣父節(jié)點的Mesh就會帶動子節(jié)點的Mesh進行變換,這樣層層的變換關(guān)系,就可以得到各個子Mesh在不同關(guān)鍵幀中的位置。關(guān)節(jié)動畫相比于關(guān)鍵幀動畫,依賴于各個關(guān)鍵幀的動畫數(shù)據(jù),可以實時的計算出各個Mesh的位置,不再受限于固定的位置,但是由于是分散的各個Mesh,這樣在不同Mesh的結(jié)合處容易出現(xiàn)裂縫。
      骨骼動畫是進一步的動畫類型,原理構(gòu)成很其簡單,但是解決問題很其有優(yōu)勢。將模型分為骨骼Bone和蒙皮Mesh兩個部分,其基本的原理可以闡述為:模型的骨骼可分為基本多層父子骨骼,在動畫關(guān)鍵幀數(shù)據(jù)的驅(qū)動下,計算出各個父子骨骼的位置,基于骨骼的控制通過頂點混合動態(tài)計算出蒙皮網(wǎng)格的頂點。在骨骼動畫中,通常包含的是骨骼層次數(shù)據(jù),網(wǎng)格Mesh數(shù)據(jù), 網(wǎng)格蒙皮數(shù)據(jù)Skin Info和骨骼的動畫關(guān)鍵幀數(shù)據(jù)。
    一、骨骼動畫、關(guān)節(jié)動畫、關(guān)鍵幀動畫
      在實際的游戲中,用得多的是這三種基本的動畫。
      在關(guān)鍵幀動畫中,模型在每個關(guān)鍵幀中都是一個固定的姿勢,相當(dāng)于一個“快照”,通過在不同的關(guān)鍵幀中進行插值平滑計算,可以得到一個較為流暢的動畫表現(xiàn)。關(guān)鍵幀動畫的一個優(yōu)勢是只需要做插值計算,相對于其他的動畫計算量很小,但是劣勢也比較明顯,基于固定的“快照”進行插值計算,表現(xiàn)大大被限制,同時插值如果不夠平滑容易出現(xiàn)尖刺等現(xiàn)象。
      關(guān)節(jié)動畫是早期出現(xiàn)的一種動畫,在這種動畫中,模型整體不是一個Mesh, 而是分為多個Mesh,通過父子的關(guān)系進行組織,這樣父節(jié)點的Mesh就會帶動子節(jié)點的Mesh進行變換,這樣層層的變換關(guān)系,就可以得到各個子Mesh在不同關(guān)鍵幀中的位置。關(guān)節(jié)動畫相比于關(guān)鍵幀動畫,依賴于各個關(guān)鍵幀的動畫數(shù)據(jù),可以實時的計算出各個Mesh的位置,不再受限于固定的位置,但是由于是分散的各個Mesh,這樣在不同Mesh的結(jié)合處容易出現(xiàn)裂縫。
      骨骼動畫是進一步的動畫類型,原理構(gòu)成很其簡單,但是解決問題很其有優(yōu)勢。將模型分為骨骼Bone和蒙皮Mesh兩個部分,其基本的原理可以闡述為:模型的骨骼可分為基本多層父子骨骼,在動畫關(guān)鍵幀數(shù)據(jù)的驅(qū)動下,計算出各個父子骨骼的位置,基于骨骼的控制通過頂點混合動態(tài)計算出蒙皮網(wǎng)格的頂點。在骨骼動畫中,通常包含的是骨骼層次數(shù)據(jù),網(wǎng)格Mesh數(shù)據(jù), 網(wǎng)格蒙皮數(shù)據(jù)Skin Info和骨骼的動畫關(guān)鍵幀數(shù)據(jù)。
    class Bone
    {
       Bone* m_pFirstChild;  
       Bone* m_pSibling;
       float m_x, m_y, m_z; // pos in parents' space
       float m_wx, m_wy, m_wz; // pos in world space
      //
      public:
      Bone(float x, float y, float z): m_pSibling(NULL),m_pFirstChild(NULL),m_pFather(NULL),m_x(x), m_y(y), m_z(z){}
    
      //
      void SetFirstChild(Bone* pChild)
      {
          m_pFirstChild = pChild;
          m_pFirstChild->m_pFather = this;
      }
      //
       void SetSibling(Bone* pSibling)
       {
          m_pSibling = pSibling;
          m_pSibling->m_pFather = m_pFather;
        }
    }
    這樣,當(dāng)父節(jié)點骨骼發(fā)生變換的時候,子節(jié)點的骨骼就會做相應(yīng)的變換,這樣的操作可以稱為 UpdateBoneMatrix,這樣的操作可以用一個方法ComputeWorldPos來表示,這樣可以用遞歸的方式在Bone中實現(xiàn)


    class Bone
    {
        void ComputeWorldPos(float fatherX, float fatherY, float fatherZ)
        {
             m_wx = fatherX + m_x;
             m_wy = fatherY + m_y;
             m_wz = fatherZ + m_z;
            //兄弟節(jié)點用父節(jié)點傳遞的參數(shù)
            if(m_pSibling !=NULL)
                 m_pSibling ->ComputeWorldPos(fatherX, fatherY, fatherZ)
            if(m_pFirstChild!=NULL)
                 m_pFirstChild ->ComputeWorldPos(m_wx, m_wy, m_wz)
        }
    }
     這樣,當(dāng)父節(jié)點骨骼發(fā)生變換的時候,子節(jié)點的骨骼都會做出相應(yīng)的變換,從而得到新的位置、朝向等信息,骨骼發(fā)生變化,從而會帶動外在的mesh發(fā)生變化,所以整體的模型就表現(xiàn)chu出運動起來?;诖?,可以理解為什么骨骼是骨骼動畫的核心。


    2、骨骼動畫中的蒙皮


      在說完骨骼后,對于整體模型在動畫中骨骼的變換,可以有一個大致的理解,當(dāng)時模型只是內(nèi)在的,外在的表現(xiàn)是模型的蒙皮的變化,所以骨骼動畫中的第二部分就是蒙皮的計算。這里的皮,就是前面說過的Mesh。


      首先,需要明確的是Mesh所在的空間。在建模的時候,模型的Mesh是和骨骼一樣處于同樣的空間中的,Mesh中的各個頂點是基于Mesh的原點來進行定位的。但是模型在運動表現(xiàn)的時候,是根據(jù)骨骼的變換來做相應(yīng)的動作的,對應(yīng)的Mesh上的頂點就需要做出對應(yīng)的轉(zhuǎn)換,所以Mesh的頂點需要轉(zhuǎn)換到對應(yīng)的骨骼所在的坐標(biāo)空間中,進行相應(yīng)的位置變換,因此對應(yīng)的需要添加蒙皮信息,也就是skin info,主要是當(dāng)前頂點受到哪些骨骼的影響,影響的權(quán)重等,借用文章1的表述,可以用C++表示一個頂點類,代碼依據(jù)于文章1:


    #define MAX_BONE_VERTEX 4
    class Vertex
    {
         float m_x, m_y, m_z; // local pos in mesh space
         float m_wx, m_wy, m_wz; // pos in world space
         //skin info
         int m_boneNum;
         Bone* m_bones[MAX_BONE_VERTEX];
         float m_boneWeights[MAX_BONE_VERTEX];
    }
        當(dāng)然,這兒只是一個簡單的表述,具體的在引擎中會有規(guī)范的設(shè)計。那么我們的頂點在跟隨骨骼做運動的時候,是如何計算自己的位置的?我們就需要引入BoneOffsetMatrix 和 Transform Matrix的概念。


         在前面,我們已經(jīng)提到,頂點需要依附于骨骼進行位置計算,但是建模的時候,頂點的位置是基于Mesh原點進行建模的,通常情況下,Mesh的原點是和模型的骨骼的根骨骼處于同一個坐標(biāo)空間中,那么 BoneOffsetMatrix就是用來將Mesh中頂點從Mesh空間轉(zhuǎn)換到骨骼所在空間中。


      在建模的時候,對于每個骨骼,我們是可以得到其對應(yīng)的Transform Matrix(用來層層計算到父節(jié)點所在空間中),其中根骨骼的Transform Matrix是基于世界空間的轉(zhuǎn)換,所以對于每一個下面的子骨骼,要計算其Transform Matrix,需要進行一個矩陣的連乘操作。*后得到的*終矩陣連乘結(jié)果矩陣就是Combined Transform Matrix,基于這個矩陣,就可以將頂點從骨骼所在的空間轉(zhuǎn)換到世界空間中。反過來,這個矩陣的逆矩陣(一般只考慮可以取逆的操作),就是從世界空間中轉(zhuǎn)換到該骨骼的空間中,由于Mesh的定義基于Mesh原點,Mesh原點就在世界空間中,所以這個逆矩陣就是要求的 Offset Matrix,也被稱為Inverse Matrix,這個逆矩陣一般實在初始位置中求得,通過取逆即可獲得。


      在實際的計算中,每個骨骼可能會對應(yīng)多個頂點,如果每個頂點都保存其對應(yīng)的骨骼的變換矩陣,那么大量的頂點就會報錯比較多的變換矩陣。所以我們只需要保存當(dāng)前該骨骼在初始位置,對應(yīng)的從世界空間到其骨骼空間的變換矩陣,那么其對應(yīng)的每個頂點在每次變換操作的時候,只需要對應(yīng)的用offset Matrix來操作即可。


          對于上面的Transform Matrix和offset Matrix,是納入了旋轉(zhuǎn)、平移和縮放的。其實offset Matrix取決于骨骼的初始位置,此時一般只包含了平移(此時還沒有動畫,所以沒有旋轉(zhuǎn)和縮放),在動畫中,一般也以縮放為主(所以大部分的動畫的關(guān)鍵幀用四元數(shù)表示)。在矩陣中都包含,是處于兼容性考慮。


      這兒就基于平移,做一個基本的蒙皮的計算過程:



    class BoneOffset
    {
     public:
        float m_offx, m_offy, m_offz; //暫時只考慮平移
    }
    
    class Bone
    {
       public :
           BoneOffset* m_boneOffset;
          //
          void ComputeBoneOffset()
          {
               m_boneOffset.m_offx -= m_wx;
               m_boneOffset.m_offy -= m_wy;
               m_boneOffset.m_offz -= m_wz;
    
                if(m_pSibling != NULL)
                   m_pSibling->ComputeBoneOffset();
                if(m_pFirstChild !=NULL)
                   m_pFirstChild->ComputeBoneOffset();
          }
    }      
    
    //頂點類的計算
    class Vertex
    {
     public:
         void ComputeWorldPosByBone(Bone* pBone, float &outX, float& outy, float& outz)
        {
       //從mesh空間轉(zhuǎn)換到bone空間
           outx = m_x + pBone->m_boneOffset.m_offx;
           outy = m_y + pBone->m_boneOffset.m_offy;
           outz = m_z + pBone->m_boneOffset.m_offz;
     //從bone空間轉(zhuǎn)換到世界空間
           outx += pBone->m_wx;
           outy += pBone->m_wy;
           outz += pBone->m_wz;
        }
        //GPU中計算頂點的位置
        void BlendVertex()
         {
           float m_wx = 0;
           float m_wy = 0;
           float m_wz = 0;
        
          for(int i=0; i < m_boneNum; i++)
           {
               float tx, ty,tz;           
               ComputeWorldPosByBone(m_bones[i], tx, ty,tz);
    
                tx *= m_boneWeights[i];
                ty *= m_boneWeights[i];
                tz *= m_boneWeights[i];
      
                m_wx += tx;
                m_wy += ty;
                m_wz += tz;
            }
         }
    }  
     仔細(xì)捋一捋上面的代碼,就可以理解整體的蒙皮變換的過程,當(dāng)然,這兒只用了矩陣變換中的平移變換,如果考慮加上旋轉(zhuǎn)和縮放,則回到*初的計算公式中了。至此,對于基本的骨骼動畫中的骨骼變換和蒙皮變換,有了一個詳細(xì)的解釋。下面說說Unity中是如何處理骨骼變換的。


    三、Unity3D骨骼動畫處理


       前面講解的對于骨骼動畫中的骨骼變換,蒙皮的計算,都是在CPU中進行的。在實際的游戲引擎中,這些都是分開處理的,較為通用的處理是將骨骼的動畫數(shù)據(jù)驅(qū)動放在CPU中,計算出骨骼的變換矩陣,然后傳遞給GPU中進行蒙皮計算。在DX10的時候,一般的shader給出的寄存器的大小在128的大小,一個變換矩陣為4x4,如果去除*后一行(0,0,0,1)就可以用3個float表示,那么*多可以表示,嗯,42個左右,如果考慮進行性能優(yōu)化,不完全占用寄存器的大小,那么一般會限制在30根骨骼的大小上。將這些骨骼的變換矩陣在CPU進行計算后,就可以封裝成skin info傳遞到GPU中。


          在GPU的計算中,就會取出這些mesh上的頂點進行對應(yīng)的位置計算,基于骨骼的轉(zhuǎn)換矩陣和骨骼的權(quán)重,得到*新的位置,從而進行一次頂點計算和描繪。之所以將骨骼動畫的兩個部分分開處理,一個原因就是CPU的處理能力相對而言沒有GPU快捷,一般一個模型的骨骼數(shù)量是較小的,但是mesh上的頂點數(shù)量較大,利用GPU的并行處理能力優(yōu)勢,可以分擔(dān)CPU的計算壓力。


          在DX11還是DX12之后(記不太清楚),骨骼變換矩陣的計算結(jié)果不再存儲在寄存器中,而是存儲在一個buffer中,這樣的buffer大小基于骨骼數(shù)量的大小在第一次計算的時候設(shè)定,之后每次骨骼動畫數(shù)據(jù)驅(qū)動得到新的變換矩陣,就依次更改對應(yīng)的buffer中存儲的變換矩陣,這樣就不再受到寄存器的大小而限制骨骼的根數(shù)的大小。但是實際的優(yōu)化中,都會盡量優(yōu)化模型的骨骼的數(shù)量,畢竟數(shù)量越多,*是影響頂點的骨骼數(shù)量越多,那么計算量就會越大,正常的思維是優(yōu)化骨骼數(shù)量而不是去擴展buffer的大?。篋


          在文章2中,對于GPU的蒙皮計算做了較大的性能優(yōu)化,主要的思維也是這樣,在CPU中進行骨骼變換,將變換的結(jié)果傳遞到GPU中,從而進行蒙皮計算。基本的思維和前面說的變換思維一致,其基本的優(yōu)化重點也是想利用一個buffer來緩存變換矩陣,從而優(yōu)化性能。這兒我就重點分析一下shader部分的代碼,其在cpu部分的代碼處理基本和前面的代碼思想一致:


          如果采用CPU的計算骨骼變換,那么GPU的shader:

    聲明: 本文轉(zhuǎn)自網(wǎng)絡(luò), 不做盈利目的,如有侵權(quán),請與我們聯(lián)系處理,謝謝。

    uniform float4x4 _Matrices[24]; //設(shè)置的骨骼數(shù)量*大為24
    
    struct appdata
    {
        float4 vertex:POSITION;
        float2 uv:TEXCOORD0;
       //存儲的就是骨骼的變換矩陣,x/y為第一個骨骼的索引和權(quán)重,z/w為第二個的索引和權(quán)重
        float4 tangent:TANGENT;
    };
    
    v2f vert(appdata v)
    {
        v2f o;
        //蒙皮計算位置,注意看,其實就是矩陣變化加權(quán)重的表示
        float4 pos = 
        mul(_Matrices[v.tangent.x], v.vertex)* v.tangent.y +
        mul(_Matrices[v.tangent.z], v.vertex)* v.tangent.w
        //通用的mvp計算
        o.vertex = mul(UNITY_MATRIX_MVP, pos);
        o.uv  = TRANSFORM_TEX(v.uv, _MainTex);
        return o;
    }
    
    //怎么計算index和權(quán)重,此處一個蒙皮頂點受到2根骨骼的影響
    Vector4[] tangents = new Vector4[mesh.vertexCount];
    for(int i=0; i < mesh.vertexCount;++i)
    {
       BoneWeight boneWeight = mesh.boneWeights[i];
       tangents[i].x = boneWeight.boneIndex0;
       tangents[i].y = boneWeight.weight0;
       tangents[i].z = boneWeight.boneIndex1;
       tangents[i].w = boneWeight.weight1;
    }
    
    newMesh.tangents = tangents;
    其優(yōu)化的策略,就是用貼圖的方式來存儲這個變換矩陣,參看一下代碼吧:
    inline float4 indexToUV(int index)
    {
        int row = (int) (index /_MatricesTexSize.x);
        int col   = (index - row * _MatricesTexsize.x; 
        return float4(col/_MatricesTexSize.x, row/_MatricesTexSize.y, 0 , 0);
    }
    //算出當(dāng)前的變換矩陣
    inline float4x4 getMatrix(int frameStartIndex, float boneIndex)
    {
         int matStartIndex = frameStartIndex + boneIndex*3;
         float4 row0 = tex2Dlod(_MatricesTex, indexToUV(matStartIndx));
         float4 row1 = tex2Dlod(_MatricesTex, indexToUV(matStartIndx + 1));
         float4 row2 = tex2Dlod(_MatricesTex, indexToUV(matStartIndx + 2));
          float4 row3 = float4(0,0,0,0);
          float4x4 mat = float4x4(row0, row1, row2, row3);
          return mat;
    }
    
    v2f vert(appdata v)
    {
         v2f o;
          float time = _Time.y;
         //算出當(dāng)前時間對應(yīng)的index
         int framIndex = (int)(((_Time.y + v.uv2.x)*_AnimFPS)%(_AnimLength * _AnimFPS));
         int frameStartIndex = frameIndex * _MatricesTexFrameTexls;
         //去除對應(yīng)的變換矩陣
         float4 mat0 = getMatrix(frameStartIndex, v.tangent.x);
         float4 mat1 = getMatrix(frameStartIndex, v.tangent.z);
       
         float4 pos =
            mul(mat0, v.vertex) * v.tangent,y + 
            mul(mat1, v.vertex) * v.tangent.w;
     
        o.vertex = mul(UNITY_MATRIX_MVP, pos);
        o.uv = TRANSFOR_TEX(v.uv, _MainTex);
        return o;
    }