임베딩벡터1 희소 표현 & 밀집 표현 & 워드 임베딩 1. 희소 표현(Sparse Representation) -원-핫 인코딩을 통해서 나온 원-핫 벡터들은 표현하고자 하는 단어의 인덱스의 값만 1이고, 나머지 인덱스에는 전부 0으로 표현되는 벡터 표현 방법 -원-핫 벡터 = 희소 벡터(sparse vector) -문제점은 단어의 개수가 늘어나면 벡터의 차원이 한없이 커진다는 점 (원-핫 벡터로 표현할 때는 갖고 있는 코퍼스에 단어가 1,000개였다면 벡터의 차원은 1,000이어야만 함) 2. 밀집 표현(Dense Representation) -사용자가 설정한 값으로 모든 단어의 벡터 표현의 차원을 맞추며 이 과정에서 0과 1값이 아닌 실수값을 가지게 됨 예) -희소표현을 사용하여 고양이의 벡터값이 [ 0 0 0 0 1 0 0 0 0 0 0 0 ... 중략.. 2021. 5. 12. 이전 1 다음