목록2025/02/02 (2)
어쩌다데싸
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/wGHGM/btsL3RXgrqs/UXcMPjMZrgqUc2kWkKkxcK/img.webp)
🏁 2025년 체험판(1월)을 마치며긴 연휴가 끝나고 나니 어느덧 2025년의 1월도 막을 내렸다. 새해가 시작된 지 얼마 안 된 것 같은데 벌써 한 달이 지나가다니. 예전이었다면 조급하게만 느껴졌을 테지만 이번엔 달랐다. 이번 1월을 2025년 정식 버전을 앞둔 체험판이라고 생각해 보기로 했다. 방향성을 점검하고, 여러 가지 시도를 해보며, 실패도 가볍게 느껴보는 시간. 이런 마인드셋을 갖게 된 건 글또의 다진마늘(의지를 다지는 소모임)에서 모임장 마늘짱이 남긴 공지문 덕분이었다. 매해 1월에는 '첫 단추를 잘 끼워야 한다'는 강박이 강하게 든다. 막상 1월이 정신없이 지나고 나면, 허무하기도 하고 열심히 하지 않은 것 같아 자책하곤 했는데 '체험판'이라는 단어 하나가 마음을 편하게 만들었다. 나는..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cl9IZq/btsL23RMQoG/FUH1P8cI9itlk00Y46i5wK/img.jpg)
AI 모델의 성능을 결정짓는 핵심은 알고리즘이 아니라 데이터의 품질입니다. 본 글에서는 변수(Feature)의 개념부터 Feature Engineering, 그리고 Embedding 기법까지 실무 관점에서 다룹니다. 특히, 데이터를 어떻게 변환하고 최적화하느냐에 따라 모델 성능이 크게 달라지는 이유와 효과적인 변수 가공 방법을 소개합니다. AI를 더 깊이 이해하고 싶은 분들을 위해 필수적인 개념과 실전 적용법을 정리했습니다. 목차 데이터를 처음 공부할 때, 우리는 보통 "어떤 모델을 써야 할까?", "최신 알고리즘은 무엇이 있을까?" 같은 질문에 집중합니다. 저 역시 마찬가지였지만 막상 3년동안 데이터 과학자 일을 하면서 가장 많이 연구했던 작업은 단연 '학습데이터를 수정하는 일'이었습니다. 모델 알고리..