목록Data&AI (3)
어쩌다데싸
행렬은 선형대수에서 단순히 숫자 배열 모음이 아니라 공간을 바꾸는 함수로 작용한다. 지난 글에서 행렬을 통해 연립방정식을 표현할 수 있다는 것을 살펴봤고, 역행렬과 행렬식을 통해 해가 유일한지 등을 구할 수 있었다. 행렬을 계산의 관점에서 살펴봤다면 이번 글에서는 '변환'의 관점에서 행렬을 다뤄보려고 한다. 선형 변환(Linear Transformation)0. 선형 변환은 왜 중요할까?AI에서 자주 사용하는 선형 회귀, PCA, 차원 축소, 임베딩, 신경망 등 대부분의 기술들은 행렬 연산을 기반으로 작동한다. 하지만 행렬을 단순히 계산을 위한 도구라고 이해하기보단 어떻게 동작하는지를 이해해야 모델에 대해 더 깊게 이해할 수 있다. 여기서 선형 변환이 중요한 이유는 행렬 연산을 '공간의 변화'로 해석할 ..
데이터 사이언티스트는 왜 선형대수를 배워야 할까? 답은 간단하다. 모든 데이터와 알고리즘 작동 근간에는 선형대수가 있기 때문이다. 사실 근간을 몰라도 당장은 큰 문제가 없다. 하지만 결국 논문을 이해하고, 응용해서 사용하기 위해서는 선형대수를 알지 못하면 뭔가 겉핥기만 하는 느낌이 들게 된다. 선형대수는 항상 마음 속 숙제같은 존재였고, 공부해도 사실 밑빠진 독에 물붓기처럼 흩어져버린다. 그래도 3번 정도 반복해서 학습하니 조금씩 개념이 잡히기 시작했다. 기본적인 개념 설명을 자세하게 하기 보다는 처음 선형대수를 공부할 때 잘 이해가 되지 않았던 내용 중심으로 정리해보려 한다. 벡터와 행렬1. 기본 개념스칼라(Scalar): 하나의 값이나 크기만 가진 단일 숫자. (차원 없음)벡터(Vector): 순서가..
AI 모델의 성능을 결정짓는 핵심은 알고리즘이 아니라 데이터의 품질입니다. 본 글에서는 변수(Feature)의 개념부터 Feature Engineering, 그리고 Embedding 기법까지 실무 관점에서 다룹니다. 특히, 데이터를 어떻게 변환하고 최적화하느냐에 따라 모델 성능이 크게 달라지는 이유와 효과적인 변수 가공 방법을 소개합니다. AI를 더 깊이 이해하고 싶은 분들을 위해 필수적인 개념과 실전 적용법을 정리했습니다. 목차 데이터를 처음 공부할 때, 우리는 보통 "어떤 모델을 써야 할까?", "최신 알고리즘은 무엇이 있을까?" 같은 질문에 집중합니다. 저 역시 마찬가지였지만 막상 3년동안 데이터 과학자 일을 하면서 가장 많이 연구했던 작업은 단연 '학습데이터를 수정하는 일'이었습니다. 모델 알고리..