Skip to content

1주차 스터디

cheongrok edited this page Sep 9, 2025 · 9 revisions

자기 소개

차례. Q1) "현재 일이든 공부든 어떤걸 하면서 지내시나요?" 양문규님 - 이현준님 - 작은 스타트업에서 LLM 관련 서비스, AI 엔지니어 양문규님 - 데이터분석, 플랫폼 개발, 시계열 분석, 예측 모델. 요즘에는 LLM의 부흥에 맞춰 입문함. 클라우드 환경에 대한 공부

Q2) "요즘 취미는요?" 이현준님 - 수영 양문규님 - 산책.

Q3) "좋아하는 음식은요?" 이현준님 - 초밥 양문규님 - 냉면, 면요리.

Q4) "좋아하는 영화나 책을 소개한다면요?" 변홍균님 - 영화: 패왕별희. 재미있다. 책: 읽으려노력중, 천개의 파랑! 이현준님 - 책: 개발서적 양문규님 - 영화: 인터스텔라(크리스토퍼놀란) 박지우님 - 영화: 인터스텔라

Q5) "내가 아끼는 것을 소개한다면요?" 변홍균님 - 욕심이 없어 아끼는게 딱히 없다 이현준님 - 컴퓨터, 물질적인 것보다 보이지 않는 것에 소중함을 느끼는 중. 양문규님 - 가족.

Q6) "MBTI는요?" 변홍균님 - ISFP 이현준님 - ISTJ 박지우님 - ESTJ 양문규님 - ISFP

Q7) "text2sql이 아니어도 학업 또는 업무에서 데이터를 다루면서 떠올린 아이디어나 해보고 싶은 것?" 변홍균님 - 회사에서 다양하게 할 수 있어 다양한 관점으로 시도. 쿼리도 없이(앰플리튜드, 태블로등) 공유. 이현준님 - 여러가지 쌓여있는 업무들. 당장 업무쳐내기도 바쁘며 그중의 하나가 Text2Sql(가장해보고싶음) for 비전공자. 양문규님 - 프롬프트가 아닌 STT로 데이터 추출해보고 싶음.

Q8) "인생에 있어서 걱정되는 것이 있다면?" 변홍균님 - 스터디 걱정.. 이현준님 - 빌더를 해봤는데, 지금 빌더님이 잘하고 러너들도 잘따라가고 잘됐으면 좋겠다. 양문규님 - 아직 입문이라 공부할게 많아서 열심히 할 예정.


역할 분담

목표) 모두가 다 구현해보고 실험해보고 아이디어를 적용해서 text2sql 성능을 올려보는 것.

-> 코드관리, 소통 등의 복잡함을 최대한 제거하기 위하여 기본적인 형태의 환경로 모두가 동일한 형태로 구성하고 기능에 대한 개발적인 분담을 따로 하지 않음.

-> 개설 내용에 나와있듯이 1주일에 최소 1~2시간 정도를 투자하는 것이다보니 진도나 성장면에서 다소 느리다고 생각하실 수 있음.

-> 시간을 더 투자하셔서 앞서나가고 앞서간만큼 스터디 구성원들에게 꼭 공유를 해주세요!


Text2SQL 스터디 환경 구성 (docker compose 기준)

Postgres (DB + pgvector)

  • 실제 SQL을 실행할 데이터베이스
  • pgvector 확장을 설치해두면 벡터 검색까지 한 컨테이너에서 처리 가능
  • 예: postgres:15 이미지 + pgvector 설치

Text2SQL API 서버 (FastAPI)

  • 사용자 자연어 질의를 받음 → OpenAI API에 프롬프트 전달해 SQL 생성 → Postgres 실행 → 결과 반환
  • 팀에서 직접 구현해야 하는 부분

Streamlit (UI)

  • 사용자들이 쉽게 질의/응답 결과를 확인할 수 있는 웹 인터페이스
  • FastAPI 서버와 연결해서 시각화, 테이블 렌더링, 로그 모니터링 가능

LLM (OpenAI API)

  • 모델 자체는 외부(OpenAI) API 사용 → 컨테이너 불필요
  • 추후 로컬 모델(Ollama, vLLM 등)로 대체 가능

누군가 도입해보셨다고 들어서 찾아본 vanna 레포지토리 ! (https://github.com/vanna-ai/vanna?tab=readme-ov-file)

image image image

공유


[번역] RAG 세상을 헤엄치는 사람들을 위한 가이드북

-> https://sigridjin.medium.com/rag-%EC%84%B8%EC%83%81%EC%9D%84-%ED%97%A4%EC%97%84%EC%B9%98%EB%8A%94-%EC%82%AC%EB%9E%8C%EB%93%A4%EC%9D%84-%EC%9C%84%ED%95%9C-%EA%B0%80%EC%9D%B4%EB%93%9C%EB%B6%81-3e90f515d800

image

-> 아직까지 기술에 비해 도메인에서의 완벽한 대체는 여전히 부족하다는 사실. 오픈소스 임베딩 모델로도 충분히 연관 문서를 잘 가져올 수 있다는 사실. 휴먼 리소스가 반드시 공존해야할 것이라는 생각.


NEXT


박지우님 - 한번해봤다. 정확도가 아쉽다. 더 잘하고 싶다. 어디가서 보여줄만한 좋은 서비스까지 만들어볼 수 있었으면 좋겠다.

변홍균님 - vanna로 한번해봤다. 명세, 쿼리를 아는 사람의 검증을 거쳐야 된다 생각. 시행착오에 대한 돌파구를 찾고 공유하고 싶다.

양문규님 - llm프로젝트 프로젝트 해봤는데 혼자하니 흐지부지. 이번기회에 MVP까지 만들고 싶다. 배우고 기본을 다지고 싶다. 최대한 MVP가 되고 싶다.

이현준님 - 열심히 하겠습니다.

Clone this wiki locally