기술

생성형 AI/LLM

Langchain: RAG(검색 증강 생성) 아키텍처 설계 및 다양한 Tools/Agents를 활용한 복합 워크플로우 자동화


MCP: LLM과 외부 데이터 소스/도구 간의 표준화된 연결을 통해 실시간 컨텍스트 및 데이터 연동 최적화


Best Practices: 시스템 프롬프트 구조화와 Few-shot 예시 최적화를 통해 토큰 사용량(Token Usage)을 절감하여 운영 비용을 효율화하고, RAG 아키텍처 내에서 동적 청킹(Chunking) 전략을 활용한 정교한 컨텍스트 관리(Context Management)로 모델의 환각 현상을 최소화합니다.

데이터 시각화

Streamlit: 데이터 애플리케이션을 빠르게 개발하고 베포할 수 있는 Python 프레임워크


Plotly: 웹 기반 대화형 시각화와 대시보드 개발을 지원하는 Python 라이브러리.


Seaborn: 데이터 시각화를 위한 Python 라이브러리로, Matplotlib 위에 구축되어 있음

데이터 엔지니어링

SQL: Microsoft SQL Server(MS-SQL)와 MySQL에 대한 전문적인 경험


Pandas: 데이터프레임 형태로 데이터를 처리하고 다양한 형식으로 내보낼 수 있음


CSV/JSON: 데이터를 처리하고 전달하는데 가장 익숙한 데이터 형식

머신 러닝

Tensorflow/Keras: LSTM, CNN 아키텍처를 활용하여 시계열 데이터(진동, 전류) 기반의 제조업 이상 탐지 및 채터링 예측 모델을 설계하고 학습시킵니다. 고도화된 딥러닝 모델을 정량화하거나 최적화하여 실시간 추론 시스템에 통합한 경험이 있습니다.


Cookiecutter: Cookiecutter를 활용해 표준화된 프로젝트 구조를 설계하여 코드의 유지보수성을 높이고 팀 협업 효율을 극대화합니다. 데이터 로딩부터 모델 학습, 평가, 배포까지의 머신러닝 생애주기(Life-cycle)를 체계적으로 관리합니다.


Scikit-learn/XGBoost: 회귀 분석, 분류, 클러스터링 등 전통적인 ML 알고리즘을 활용해 정형 데이터의 패턴을 분석합니다. 데이터 전처리 파이프라인(Scaling, Encoding) 구축 및 주요 특성 추출(Feature Selection)을 통해 모델의 설명 가능성(Explainability)과 성능을 동시에 확보합니다.

개발툴/협업툴

Jira: 프로젝트 관리 및 이슈 추적 위해 사용


Git/Github: 버전 관리 및 백업 용도로 사용


Pycharm: 주요 Python 프로그래밍을 위한 통합 개발 환경(IDE)으로, 코드 편집, 디버깅, 테스팅 등의 기능


Docker: 애플리케이션과 그 종속성을 격리된 컨테이너에 패키징하고 배포할 수 있는 컨테이너화 플랫폼

웹개발

Django: 웹 개발을 위한 고급 Python 프레임워크로, 데이터베이스 연동, 템플릿 엔진, 관리 인터페이스 등


FastAPI: 빠르고 효율적인 웹 API 개발을 위한 Python 프레임워크


Flask: 마이크로 웹 프레임워크로, 간단한 Web 애플리케이션 개발 위해 사용


Pytest: Python을 위한 강력한 테스팅 프레임워크로, 단위 테스트, 통합 테스트 등