[Tensorflow 2] tf.concat , axis = -1, 0, 1 의미

tf.concat(
values, axis, name='concat'
)

tf.concat 은 단순하게 설명하자면, 장난감 블록을 붙이듯 axis 축에 대하여 자료를 합체시키는 것이다.

이때, 중요한 것은 자료들의 차원이 같아야한다.

또한, 붙이려는 방향의 블록 구조가 같아야 한다.

자료들안의 '[ ]' 의 개수와 위치로 자료의 구조를 알 수 있다.

행렬의 shape에 집중해서 보자.

( 2차원, 1차원 ) 으로 위치를 생각하면 쉽다.

( axis=0 , axis=1 )

( axis=-2 , axis =-1 )

3차원이 된다면 앞쪽에 숫자하나를 더 넣어주면 된다.

( 3차, 2차, 1차 ) 이런식으로 차원이 추가 될 수록 덧붙여진다.

( axis=0, axis=1, axis=2)

( axis=-3, axis=-2 , axis =-1 )

1. axis = 0

>>> t1 = [[1, 2, 3], [4, 5, 6]]      # dim = 2
>>> t2 = [[7, 8, 9], [10, 11, 12]]   # dim = 2 
>>> tf.concat([t1, t2],0)            # axis = 0
<tf.Tensor: shape=(4, 3), dtype=int32, numpy=
array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])>               # dim = 2

t1 과 t2는 모두 2차원 ( 2 X 3 )행렬이라고 생각하자.

axis 는 붙이는 축이라고 생각하면 쉽다.

axis = 0 이라는건 가장 높은 차원을 기준으로 합치는 것이다.

모두 2차원의 행렬이니 1차원은 그대로 두고 2차원의 위치를 붙여준다.

결과는 (4 X 3) 행렬이 나온다.

3차원 tensor 자료는 어떻게 합쳐질까?

>>> t1 = [[[1, 2, 3], [4, 5, 6]]]
>>> t2 = [[[7, 8, 9], [10, 11, 12]]]
>>> tf.concat([t1, t2],0)
<tf.Tensor: shape=(2, 2, 3), dtype=int32, numpy=
array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])>

t1 과 t2는 모두 3차원 ( 1 X 2 X 3 ) tensor라고 생각하자.

위의 2차원 모양과 달라진 것이 있다면 차원이 추가 된 것 뿐이다.

이번에는 차원이 3차원이다.

두 tesnor를 axis = 0에 tf.concat 하면 1,2 차원의 모양은 그대로 두고,

자연스럽게 ( 2 X 2 X 3 )의 모양이 된다.

자 이번에는 숫자는 같지만, t1, t2의 shape이 다르다. 결과 또한 다르다.

>>> t1 = [[[1, 2, 3]], [[4, 5, 6]]]
>>> t2 = [[[7, 8, 9]], [[10, 11, 12]]]
>>> tf.concat([t1, t2],0)
<tf.Tensor: shape=(4, 1, 3), dtype=int32, numpy=
array([[[ 1,  2,  3]],

       [[ 4,  5,  6]],

       [[ 7,  8,  9]],

       [[10, 11, 12]]])>

t1 과 t2는 모두 여전히 3차원이지만, ( 2 X 1 X 3 ) tensor 이다.

axis = 0 대해서 붙이면 ( 4 X 1 X 3 ) tensor가 되는 것을 알 수 있다.

가장 높은 3차원을 기준으로 붙이는 것이다.

차이를 알겠는가?

모르겠다면 예제에서 괄호 '[ ]' 의 위치와 개수를 다시한번 보기를 바란다.

2. axis = 1

위의 예제를 이해했다면

axis = 0 은 제일 높은 차원을 기준으로 합쳤다는 것을 안다.

axis = 1 은 두 번째로 높은 차원을 기준으로 합치는 것이다.

2차원 자료라면 -> 1차원을 기준으로 붙이고

3차원 자료라면 -> 2차원을 기준으로 붙이면 된다.

예제를 통해 알아보자

>>> t1 = [[1, 2, 3], [4, 5, 6]]
>>> t2 = [[7, 8, 9], [10, 11, 12]]
>>> tf.concat([t1, t2],1)
<tf.Tensor: shape=(2, 6), dtype=int32, numpy=
array([[ 1,  2,  3,  7,  8,  9],
       [ 4,  5,  6, 10, 11, 12]])>

t1 과 t2는 모두 2차원 ( 2 X 3 ) 행렬 (matrix) 이다.

axis = 1 일 때, 1차원을 기준으로 붙여주면 ( 2 X 6 ) 행렬이 된다.

자료가 3차원 일때도 똑같다.

>>> t1 = [[[1, 2, 3]], [[4, 5, 6]]]
>>> t2 = [[[7, 8, 9]], [[10, 11, 12]]]
>>> tf.concat([t1, t2],1)
<tf.Tensor: shape=(2, 2, 3), dtype=int32, numpy=
array([[[ 1,  2,  3],
        [ 7,  8,  9]],

       [[ 4,  5,  6],
        [10, 11, 12]]])>

t1 과 t2는 모두 3차원이고, 크기가 ( 2 X 1 X 3 ) 인 tensor 이다.

axis = 1 에 대해서 tf.concat 했을때, 2차원을 기준으로 붙이고,

( 2 X 2 X 3 ) tensor가 만들어 짐을 알 수 있다.

햇갈린다면, [ ] 의 위치와 개수를 다시한번 확인해 보기 바란다.

3차원일때 axis =2도 가능하고, 이때에는 1차원을 기준으로 붙여주면 된다.

이런식으로 axis는 자료의 차원(dim)에 따라서 달라지고 적용할 때 주의 해야된다.

axis 가 만약 음수라면 어떻게 될까?

3. axis = -1

axis = -1 은 가장 낮은 차원 뒤쪽에서부터 시작한다.

자료가 2차원이라면 -> 1차원을 기준으로 붙인다,

( axis=0 , axis=1 )

( axis=-2 , axis =-1 ) 같은 의미 이다.

예를 통해 이해해 보자.

>>> t1 = [[1, 2, 3], [4, 5, 6]]
>>> t2 = [[7, 8, 9], [10, 11, 12]]
>>> tf.concat([t1, t2],-1)                     # axis = -1
<tf.Tensor: shape=(2, 6), dtype=int32, numpy=
array([[ 1,  2,  3,  7,  8,  9],
       [ 4,  5,  6, 10, 11, 12]])>
       
>>> tf.concat([t1, t2],1)                      # axis = 1
<tf.Tensor: shape=(2, 6), dtype=int32, numpy=
array([[ 1,  2,  3,  7,  8,  9],
       [ 4,  5,  6, 10, 11, 12]])>

자료가 2차원이고 axis = -1 이면 1차원에서 붙이라는 의미이다.

axis =1 일때와 결과가 같다.

3차원일 때, 더 잘 이해가 될 것이다.

자료가 3차원이라면 -> 1차원을 기준으로 붙인다.

( axis=0, axis=1, axis=2)

( axis=-3, axis=-2 , axis =-1 ) 같은 의미이다.

>>> t1 = [[[1, 2, 3]], [[4, 5, 6]]]
>>> t2 = [[[7, 8, 9]], [[10, 11, 12]]]
>>> tf.concat([t1, t2],-1)                        # axis = -1
<tf.Tensor: shape=(2, 1, 6), dtype=int32, numpy=
array([[[ 1,  2,  3,  7,  8,  9]],

       [[ 4,  5,  6, 10, 11, 12]]])>
       
>>> tf.concat([t1, t2], 2)                        # axis = 2       
<tf.Tensor: shape=(2, 1, 6), dtype=int32, numpy=
array([[[ 1,  2,  3,  7,  8,  9]],

       [[ 4,  5,  6, 10, 11, 12]]])>

자료가 3차원 이기 때문에 똑같이 가장 낮은 1차원에서 붙인다.

t1 과 t2는 모두 3차원이고, 크기가 ( 2 X 1 X 3 ) 인 tensor 이다.

axis = -1의 결과는 크기가 ( 2 X 1 X 6 ) 인 tensor 이다.

이런식으로 조절할 수 있다.

SuperMemi's Study

[Tensorflow 2] tf.concat , axis = -1, 0, 1 의미