• 돌아가기
  • 아래로
  • 위로
  • 목록
  • 댓글

Chat GPT를 자체호스팅 ? Serge

달소 달소 1339

0

15

제목이 어그로 같겠지만,, 어그로는 아닙니다.

한번 테스트해주실분 급구합니다 ㅋㅋ 한글이 되는지 궁금하네요

 

더 발전했으면,,,

 


 

 

llama.cppAlpaca 모델 실행을 기반으로 하는 채팅 인터페이스입니다 . 완전히 자체 호스팅되며 API 키가 필요하지 않습니다. 4GB RAM에 적합하며 CPU에서 실행됩니다.

  • SvelteKit 프런트엔드
  • 채팅 기록 및 매개변수 저장을 위한 MongoDB
  • FastAPI + API용 비니, 다음으로 호출 래핑llama.cpp

시작하기


Serge 설정은 매우 쉽습니다. Alpaca 7B로 실행하기 위한 TLDR:

 

git clone https://github.com/nsarrazin/serge.git && cd serge

cp .env.sample .env

docker compose up -d
docker compose exec api python3 /usr/src/app/utils/download.py tokenizer 7B


7B 13B 30B( 여러 모델을 다운로드하려면 인수로 전달할 수 있습니다 .)

그런 다음 http://localhost:8008/ 로 이동하면 됩니다.

 

모델
현재 7B, 13B 및 30B 알파카 모델만 지원됩니다. 위에서 설명한 컨테이너 내부에 다운로드하기 위한 다운로드 스크립트가 있습니다.

다른 프로젝트의 기존 가중치가 있는 경우 api/weights폴더에 추가할 수 있으며 빌드 시 자동으로 복사됩니다.

 

신고공유스크랩
15
profile image 1등
한군77 2023.03.23. 17:04
아 페이스북껀가보네요 ㅎㅎ 웹 연동이 잘 될지.. 백그라운드에서 페북으로 뭐 보내고있는건 아닐련지 ㅎㅎㅎㅎ (농담)
콜라 2023.03.23. 19:40
똥쓰똥쓰
모델이 있는걸 봐선 학습은 아니고, 학습된 모델로 만드는것 같아요.
ai가 학습이 힘들지, 한번 학습시킨거 적용하고 사용하는건 쉽거든요!
3등
레노 2023.03.23. 17:32
원래 자연어처리 모델들이 VRAM을 어마무시하게 잡아 먹는데 신기하게 CPU랑 RAM 4GB 잡아먹네요? 시간날 때 테스트해보고 싶네요 ㅋㅋ
뻘짓의초심자 2023.03.23. 17:47
원래 제한적 배포였다가 누군가 토렌트로 풀어버렸다는 그 llama군요 ㅋㅋ
요즘 라즈베리에서도 돌린다는데 docker까지 나왔었군요...
참고로 아직 상업적이용은 불가일겁니다(지구환경을 명분으로 풀어달라는 탄원도 있는걸로는 압니다)
eyeball 2023.03.24. 11:17

잠시 월급루팡 하며 가지고 놀아봤는데 영어만 가능합니다.
4GB는 7B 모델에서만 가능하네요. 세션(대화)당 CPU 4코어를 풀로드 하고 첫 대화는 4기가. 이후 대화가 진행될 수록 약간씩 증가합니다. 8기가 정도는 되야 원활한 진행이 됩니다.
30B 모델도 돌려봤는데 코어 로드는 동일하고 메모리는 40기가 정도 먹네요. 그리고 응답속도도 매우 느려서 조금 긴 문장을 던지면 타임아웃에 걸립니다. CPU로는 한계가 있어보이네요.

profile image
달소 글쓴이 2023.03.24. 11:38
eyeball
오오 사용후기 감사드립니다.gpu 지원까지 기다려야 유의미한결과가 나오겠네요
eyeball 2023.03.24. 12:22

32코어에 RTX A4000 달린 장비에서도 돌려봤는데 기본값으로는 그냥 CPU 4코어만 갈굽니다.
프로젝트 까서 만져주면 CPU를 다 쓰던지 GPU를 쓰던지 하게 할 수 있긴 하겠지만 루팡은 여기까지..ㅎㅎ
일단 한국어가 안 돼서 내부망만 되는 직원들 장난감으로 던져주기도 애매하네요

profile image
달소 글쓴이 2023.03.24. 12:44
eyeball
네 ㅠㅠ 아직은 gpu쪽 할당관련 옵션이 없는걸로 봐서는 cpu만 갈굴거같네요..
한국어만 지원되면 재미있을텐데요 ㅋㅋ

댓글 쓰기 권한이 없습니다. 로그인

취소 댓글 등록

cmt alert

신고

"님의 댓글"

이 댓글을 신고하시겠습니까?

댓글 삭제

"님의 댓글"

삭제하시겠습니까?


목록

공유

facebooktwitterpinterestbandkakao story
번호 제목 글쓴이 날짜 조회 추천
iventoy pxe는 속도가 엄청 느리군요.. nohdd는 왜 빠르지.. 음... purndal 8시간 전00:52 58 +1
proxmox로 갈아탔습니다 7 기현 2일 전07:34 374 +2
Immich가 FUTO에 합류했습니다.(Immich 핵심 팀은 정규직으로 근무합니다.) 4 달소 2일 전11:38 286 +1
3698
normal
고심분투 1일 전17:10 177 0
3697
image
기현 2일 전07:34 374 +2
3696
image
keiminem 2일 전13:12 470 0
3695
normal
달소 2일 전11:38 286 +1
3694
normal
홍익 3일 전19:26 218 0
3693
image
지딱코 3일 전14:31 226 +1
3692
image
달소 4일 전22:22 377 +3
3691
image
ljr10 5일 전08:20 173 0
3690
image
달소 5일 전06:46 190 +1
3689
image
달소 5일 전05:50 221 +6
3688
image
달소 5일 전05:38 130 0
3687
image
달소 5일 전05:20 427 0
3686
image
keiminem 5일 전17:43 372 +3
3685
normal
purndal 5일 전14:32 243 0
3684
image
초보나스 5일 전10:46 109 0
3683
image
달소 5일 전10:03 344 0
3682
normal
keiminem 6일 전09:29 344 0
3681
normal
kmw_ 6일 전09:11 165 0
3680
normal
환경설정 6일 전13:31 405 0
3679
image
지축또타 24.04.28.23:02 366 +1