돌아가기
아래로
위로

Chat GPT를 자체호스팅 ? Serge

달소 1년 전 1337

4fedee295907c6df27471c888d15e9f6.png.jpg

GitHub - nsarrazin/serge: A web interface for chatting with Alpaca through llama.cpp. Fully dockerized, with an easy to use API. A web interface for chatting with Alpaca through llama.cpp. Fully dockerized, with an easy to use API. - GitHub - nsarrazin/serge: A web interface for chatting with Alpaca through llama.cpp. Fully ... from GITHUB

제목이 어그로 같겠지만,, 어그로는 아닙니다.

한번 테스트해주실분 급구합니다 ㅋㅋ 한글이 되는지 궁금하네요

더 발전했으면,,,

llama.cppAlpaca 모델 실행을 기반으로 하는 채팅 인터페이스입니다 . 완전히 자체 호스팅되며 API 키가 필요하지 않습니다. 4GB RAM에 적합하며 CPU에서 실행됩니다.

SvelteKit 프런트엔드
채팅 기록 및 매개변수 저장을 위한 MongoDB
FastAPI + API용 비니, 다음으로 호출 래핑llama.cpp

시작하기

Serge 설정은 매우 쉽습니다. Alpaca 7B로 실행하기 위한 TLDR:

git clone https://github.com/nsarrazin/serge.git && cd serge

cp .env.sample .env

docker compose up -d
docker compose exec api python3 /usr/src/app/utils/download.py tokenizer 7B

7B 13B 30B( 여러 모델을 다운로드하려면 인수로 전달할 수 있습니다 .)

그런 다음 http://localhost:8008/ 로 이동하면 됩니다.

모델
현재 7B, 13B 및 30B 알파카 모델만 지원됩니다. 위에서 설명한 컨테이너 내부에 다운로드하기 위한 다운로드 스크립트가 있습니다.

다른 프로젝트의 기존 가중치가 있는 경우 api/weights폴더에 추가할 수 있으며 빌드 시 자동으로 복사됩니다.

신고공유스크랩

달소

97Lv. 191612P
다음 레벨까지 468P

메인서버 - Ryzen 5700G / Proxmox 7.2 / Ubuntu / Xpenology / 기타 VM 등등
보조서버 - Intel i9-9900ES(QQC0) / H370M / Proxmox 7.1 / 아직개발용서버로 사용중
백업스토리지서버 - DS920+
하드웨어,가상화 등등 여러 IT분야에 관심이 두루두루많습니다만 깊게알고있는건 없습니다 하하하

1등

한군77 2023.03.23. 17:04

아 페이스북껀가보네요 ㅎㅎ 웹 연동이 잘 될지.. 백그라운드에서 페북으로 뭐 보내고있는건 아닐련지 ㅎㅎㅎㅎ (농담)

댓글 댓글주소복사

2등

똥쓰똥쓰 2023.03.23. 17:21

이게 뭔가요? nas에서 ai 학습시켜 운영하는건가요? ㅎㅎㅎ

댓글 댓글주소복사

콜라 2023.03.23. 19:40

똥쓰똥쓰

모델이 있는걸 봐선 학습은 아니고, 학습된 모델로 만드는것 같아요.
ai가 학습이 힘들지, 한번 학습시킨거 적용하고 사용하는건 쉽거든요！

댓글 댓글주소복사

3등

레노 2023.03.23. 17:32

원래 자연어처리 모델들이 VRAM을 어마무시하게 잡아 먹는데 신기하게 CPU랑 RAM 4GB 잡아먹네요? 시간날 때 테스트해보고 싶네요 ㅋㅋ

댓글 댓글주소복사

뻘짓의초심자 2023.03.23. 17:47

원래 제한적 배포였다가 누군가 토렌트로 풀어버렸다는 그 llama군요 ㅋㅋ
요즘 라즈베리에서도 돌린다는데 docker까지 나왔었군요...
참고로 아직 상업적이용은 불가일겁니다(지구환경을 명분으로 풀어달라는 탄원도 있는걸로는 압니다)

댓글 댓글주소복사

kyaru 2023.03.23. 18:34

데이터 학습같은 경우는 어떻게 해야할지 궁금하네요

댓글 댓글주소복사

ExpBox 2023.03.24. 00:20

cpu로 그것도 4GB 메모리로만 돌아가는게 신기하네요.

댓글 댓글주소복사

kyaru 2023.03.24. 10:32

env 복사하실 때 env파일 여셔서 secret_key 수정해주셔야 합니다.

댓글 댓글주소복사

eyeball 2023.03.24. 11:17

잠시 월급루팡 하며 가지고 놀아봤는데 영어만 가능합니다.
4GB는 7B 모델에서만 가능하네요. 세션(대화)당 CPU 4코어를 풀로드 하고 첫 대화는 4기가. 이후 대화가 진행될 수록 약간씩 증가합니다. 8기가 정도는 되야 원활한 진행이 됩니다.
30B 모델도 돌려봤는데 코어 로드는 동일하고 메모리는 40기가 정도 먹네요. 그리고 응답속도도 매우 느려서 조금 긴 문장을 던지면 타임아웃에 걸립니다. CPU로는 한계가 있어보이네요.

댓글 댓글주소복사

eyeball 2023.03.24. 11:21

eyeball

스페인어와 프랑스어까진 할 줄 안다고 합니다 ㅎㅎ

댓글 댓글주소복사

달소 글쓴이 2023.03.24. 11:38

eyeball

오오 사용후기 감사드립니다.gpu 지원까지 기다려야 유의미한결과가 나오겠네요

댓글 댓글주소복사

뻘짓의초심자 2023.03.24. 11:52

eyeball

방금전에 구형컴으로 13B하다가 500엔딩을 당해봤습니다...

댓글 댓글주소복사

달소 글쓴이 2023.03.24. 11:59

뻘짓의초심자

댓글 댓글주소복사

eyeball 2023.03.24. 12:22

32코어에 RTX A4000 달린 장비에서도 돌려봤는데 기본값으로는 그냥 CPU 4코어만 갈굽니다.
프로젝트 까서 만져주면 CPU를 다 쓰던지 GPU를 쓰던지 하게 할 수 있긴 하겠지만 루팡은 여기까지..ㅎㅎ
일단 한국어가 안 돼서 내부망만 되는 직원들 장난감으로 던져주기도 애매하네요

댓글 댓글주소복사

달소 글쓴이 2023.03.24. 12:44

eyeball

네 ㅠㅠ 아직은 gpu쪽 할당관련 옵션이 없는걸로 봐서는 cpu만 갈굴거같네요..
한국어만 지원되면 재미있을텐데요 ㅋㅋ

댓글 댓글주소복사

cmt alert

번호	분류	제목	글쓴이	날짜	조회	추천
	질문	적용 방법을 모르겠습니다?? 10	초보나스	1일 전08:05	225	+1
	잡담	php가 벌써 8.36까지 나왔습니다. 5	달소	3일 전23:39	196	+2
	질문	proxmox ssd 인식이 갑자기 안됩니다 고장인걸까요? 3	kmw_	5일 전09:37	192	+1
3854	질문	normal 미니pc 사양추천.. 16	서버구축하자	12시간 전13:09	287	0
3853	질문	image N100 iGPU 윈도우11 패스스루 미스터리... 6	미스터빈	1일 전20:09	175	0
3852	질문	image 적용 방법을 모르겠습니다?? 10	초보나스	1일 전08:05	225	+1
3851	질문	normal 포트폴리오용 개인 서버에서 동적인 웹사이트를 만들고 싶은데 도저히 해결 방법을 못찾아서 질문 드립니다. 6	웹서버구축관심	2일 전02:22	300	0
3850	잡담	normal php가 벌써 8.36까지 나왔습니다. 5	달소	3일 전23:39	196	+2
3849	질문	normal fail2ban 차단이 계속 안돼서 몇시간을 헤맸는데 답을 찾은 것 같습니다. 5	게르노	3일 전03:11	182	0
3848	질문	image 인텔 12세대 plex hw 트랜스코딩 방법 질문드립니다... 31	감자칩	4일 전20:04	278	0
3847	질문	normal local-lvm 삭제 방법 2	ljr10	4일 전19:45	194	0
3846	질문	image Proxmox + Portainer 질문드립니다 6	TANG	4일 전11:33	222	0
3845	질문	normal 인텔 12세대 plex hw 트랜스코딩 질문이요 2	감자칩	5일 전18:55	148	0
3844	질문	normal 타워워크스테이션 구매관련하여 IT신생아 질문드립니다 ㅜ 9	숲형	5일 전11:21	276	0
3843	질문	image proxmox ssd 인식이 갑자기 안됩니다 고장인걸까요? 3	kmw_	5일 전09:37	192	+1
3842	질문	normal ZFS 풀에서 계속 에러가 뜹니다 3	bass9030	6일 전00:43	138	+1
3841	잡담	normal 백업 주기와 방법에 대한 고민 12	칼룬	6일 전18:12	276	+1
3840	질문	normal opensense 를 사용하여 망내의 서버를 구축하고, 외부에서 접속하는 사용자의 IP를 확인할수 있을까요? 2	늘맑음	6일 전15:10	243	+1
3839	질문	image OMV hdparm 하드 전원 설정 어떻게 해야하나요?	게르노	6일 전12:26	89	0
3838	잡담	normal 프록스목스 기업용으로 써도되나요? 1	bong90a	6일 전10:50	439	0
3837	후기	image wyse 5010 싸고 좋습니다. 5	추주비	6일 전10:33	329	+1
3836	질문	normal 초보자한테 제일 좋은 OS는 어떤것이려나요? 11	angrynerd	24.04.17.14:11	508	0
3835	오픈소스	image ChatGPT, LocalAI 등을 하나로 통합하기 big-AGI 5	달소	24.04.15.23:00	462	0

Chat GPT를 자체호스팅 ? Serge

시작하기

모델
현재 7B, 13B 및 30B 알파카 모델만 지원됩니다. 위에서 설명한 컨테이너 내부에 다운로드하기 위한 다운로드 스크립트가 있습니다.

달소

97Lv. 191612P
다음 레벨까지 468P

오늘의 베스트(조회순)

주간 베스트(추천순)

시작하기

모델 현재 7B, 13B 및 30B 알파카 모델만 지원됩니다. 위에서 설명한 컨테이너 내부에 다운로드하기 위한 다운로드 스크립트가 있습니다.

달소 97Lv. 191612P 다음 레벨까지 468P

신고

댓글 삭제

공유

오늘의 베스트(조회순)

주간 베스트(추천순)

검색

로그인

모델
현재 7B, 13B 및 30B 알파카 모델만 지원됩니다. 위에서 설명한 컨테이너 내부에 다운로드하기 위한 다운로드 스크립트가 있습니다.

달소

97Lv. 191612P
다음 레벨까지 468P