• 돌아가기
  • 아래로
  • 위로
  • 목록
  • 댓글

Chat GPT를 자체호스팅 ? Serge

달소 달소 1337

0

15

제목이 어그로 같겠지만,, 어그로는 아닙니다.

한번 테스트해주실분 급구합니다 ㅋㅋ 한글이 되는지 궁금하네요

 

더 발전했으면,,,

 


 

 

llama.cppAlpaca 모델 실행을 기반으로 하는 채팅 인터페이스입니다 . 완전히 자체 호스팅되며 API 키가 필요하지 않습니다. 4GB RAM에 적합하며 CPU에서 실행됩니다.

  • SvelteKit 프런트엔드
  • 채팅 기록 및 매개변수 저장을 위한 MongoDB
  • FastAPI + API용 비니, 다음으로 호출 래핑llama.cpp

시작하기


Serge 설정은 매우 쉽습니다. Alpaca 7B로 실행하기 위한 TLDR:

 

git clone https://github.com/nsarrazin/serge.git && cd serge

cp .env.sample .env

docker compose up -d
docker compose exec api python3 /usr/src/app/utils/download.py tokenizer 7B


7B 13B 30B( 여러 모델을 다운로드하려면 인수로 전달할 수 있습니다 .)

그런 다음 http://localhost:8008/ 로 이동하면 됩니다.

 

모델
현재 7B, 13B 및 30B 알파카 모델만 지원됩니다. 위에서 설명한 컨테이너 내부에 다운로드하기 위한 다운로드 스크립트가 있습니다.

다른 프로젝트의 기존 가중치가 있는 경우 api/weights폴더에 추가할 수 있으며 빌드 시 자동으로 복사됩니다.

 

신고공유스크랩
15
profile image 1등
한군77 2023.03.23. 17:04
아 페이스북껀가보네요 ㅎㅎ 웹 연동이 잘 될지.. 백그라운드에서 페북으로 뭐 보내고있는건 아닐련지 ㅎㅎㅎㅎ (농담)
콜라 2023.03.23. 19:40
똥쓰똥쓰
모델이 있는걸 봐선 학습은 아니고, 학습된 모델로 만드는것 같아요.
ai가 학습이 힘들지, 한번 학습시킨거 적용하고 사용하는건 쉽거든요!
3등
레노 2023.03.23. 17:32
원래 자연어처리 모델들이 VRAM을 어마무시하게 잡아 먹는데 신기하게 CPU랑 RAM 4GB 잡아먹네요? 시간날 때 테스트해보고 싶네요 ㅋㅋ
뻘짓의초심자 2023.03.23. 17:47
원래 제한적 배포였다가 누군가 토렌트로 풀어버렸다는 그 llama군요 ㅋㅋ
요즘 라즈베리에서도 돌린다는데 docker까지 나왔었군요...
참고로 아직 상업적이용은 불가일겁니다(지구환경을 명분으로 풀어달라는 탄원도 있는걸로는 압니다)
eyeball 2023.03.24. 11:17

잠시 월급루팡 하며 가지고 놀아봤는데 영어만 가능합니다.
4GB는 7B 모델에서만 가능하네요. 세션(대화)당 CPU 4코어를 풀로드 하고 첫 대화는 4기가. 이후 대화가 진행될 수록 약간씩 증가합니다. 8기가 정도는 되야 원활한 진행이 됩니다.
30B 모델도 돌려봤는데 코어 로드는 동일하고 메모리는 40기가 정도 먹네요. 그리고 응답속도도 매우 느려서 조금 긴 문장을 던지면 타임아웃에 걸립니다. CPU로는 한계가 있어보이네요.

profile image
달소 글쓴이 2023.03.24. 11:38
eyeball
오오 사용후기 감사드립니다.gpu 지원까지 기다려야 유의미한결과가 나오겠네요
eyeball 2023.03.24. 12:22

32코어에 RTX A4000 달린 장비에서도 돌려봤는데 기본값으로는 그냥 CPU 4코어만 갈굽니다.
프로젝트 까서 만져주면 CPU를 다 쓰던지 GPU를 쓰던지 하게 할 수 있긴 하겠지만 루팡은 여기까지..ㅎㅎ
일단 한국어가 안 돼서 내부망만 되는 직원들 장난감으로 던져주기도 애매하네요

profile image
달소 글쓴이 2023.03.24. 12:44
eyeball
네 ㅠㅠ 아직은 gpu쪽 할당관련 옵션이 없는걸로 봐서는 cpu만 갈굴거같네요..
한국어만 지원되면 재미있을텐데요 ㅋㅋ

댓글 쓰기 권한이 없습니다. 로그인

취소 댓글 등록

cmt alert

신고

"님의 댓글"

이 댓글을 신고하시겠습니까?

댓글 삭제

"님의 댓글"

삭제하시겠습니까?


목록

공유

facebooktwitterpinterestbandkakao story
번호 분류 제목 글쓴이 날짜 조회 추천
질문 적용 방법을 모르겠습니다?? 10 초보나스 1일 전08:05 225 +1
잡담 php가 벌써 8.36까지 나왔습니다. 5 달소 3일 전23:39 196 +2
질문 proxmox ssd 인식이 갑자기 안됩니다 고장인걸까요? 3 kmw_ 5일 전09:37 192 +1
3854 질문
normal
서버구축하자 12시간 전13:09 287 0
3853 질문
image
미스터빈 1일 전20:09 175 0
3852 질문
image
초보나스 1일 전08:05 225 +1
3851 질문
normal
웹서버구축관심 2일 전02:22 300 0
3850 잡담
normal
달소 3일 전23:39 196 +2
3849 질문
normal
게르노 3일 전03:11 182 0
3848 질문
image
감자칩 4일 전20:04 278 0
3847 질문
normal
ljr10 4일 전19:45 194 0
3846 질문
image
TANG 4일 전11:33 222 0
3845 질문
normal
감자칩 5일 전18:55 148 0
3844 질문
normal
숲형 5일 전11:21 276 0
3843 질문
image
kmw_ 5일 전09:37 192 +1
3842 질문
normal
bass9030 6일 전00:43 138 +1
3841 잡담
normal
칼룬 6일 전18:12 276 +1
3840 질문
normal
늘맑음 6일 전15:10 243 +1
3839 질문
image
게르노 6일 전12:26 89 0
3838 잡담
normal
bong90a 6일 전10:50 439 0
3837 후기
image
추주비 6일 전10:33 329 +1
3836 질문
normal
angrynerd 24.04.17.14:11 508 0
3835 오픈소스
image
달소 24.04.15.23:00 462 0