2025-04-11 게시 됨2025-06-29 업데이트 됨AI / LLM21분안에 읽기 (약 3205 단어)

대형언어모델을 운용할 때 사용하는 다양한 활용 방법을 요약했다.

LLM 활용

Open-source LLMs

2025 년 주요 LLM base models

[https://blog.n8n.io/open-source-llm/\]

LLM의 주요 활용 분야

LLM은 그 자체로도 강력하지만, 다른 기술과 결합하거나 특정 목적에 맞춰 미세 조정될 때 더욱 큰 시너지를 낼 수 있습니다. 주요 활용 분야는 다음과 같습니다.

1. 콘텐츠 생성 및 요약

보고서, 기사, 블로그 게시물 작성: 주어진 주제나 키워드를 바탕으로 자연스럽고 설득력 있는 글을 자동으로 생성합니다.
마케팅 문구 및 광고 카피: 제품이나 서비스의 특징을 분석하여 매력적인 광고 문구를 제안합니다.
창의적인 글쓰기: 시, 소설, 시나리오 등 문학 작품 창작에 도움을 주거나 새로운 아이디어를 제시합니다.
텍스트 요약 및 정보 추출: 긴 문서나 여러 개의 문서를 핵심 내용만 간추려 요약하거나 특정 정보를 추출합니다.
번역: 자연스럽고 정확한 언어 번역을 제공하며, 문맥을 이해하여 문화적 뉘앙스까지 반영하려 노력합니다.

2. 고객 서비스 및 상호작용

챗봇 및 가상 비서: 고객 문의에 실시간으로 응답하고, FAQ를 기반으로 정보를 제공하며, 기본적인 상담 업무를 처리합니다.
개인화된 추천 시스템: 사용자의 선호도나 과거 행동을 분석하여 맞춤형 제품, 콘텐츠, 서비스를 추천합니다.
음성 인식 및 합성: 음성 명령을 텍스트로 변환하거나 텍스트를 자연스러운 음성으로 변환하여 상호작용을 돕습니다.

3. 교육 및 학습

개인 맞춤형 학습 콘텐츠: 학생의 학습 수준과 목표에 맞춰 최적화된 학습 자료나 문제 풀이를 제공합니다.
튜터링 및 질의응답: 특정 개념에 대한 질문에 답변하고, 예시를 들어 설명하며 학습을 돕습니다.
언어 학습: 외국어 학습 시 발음 교정, 문법 오류 수정, 회화 연습 상대 등의 역할을 수행합니다.

4. 코드 생성 및 개발

코드 자동 완성 및 생성: 개발자가 코드를 작성할 때 다음 코드를 예측하여 자동 완성하거나, 특정 기능에 대한 코드를 생성합니다.
버그 수정 및 코드 최적화: 기존 코드의 오류를 찾아내고 수정 방법을 제안하거나, 성능 개선을 위한 최적화 방안을 제시합니다.
설명서 작성: 코드에 대한 주석이나 API 문서 등을 자동으로 생성하여 개발 생산성을 높입니다.

5. 데이터 분석 및 인사이트 도출

비정형 데이터 분석: 고객 피드백, 소셜 미디어 게시물 등 비정형 텍스트 데이터에서 유의미한 패턴이나 트렌드를 발견합니다.
시장 조사: 방대한 양의 시장 보고서나 뉴스 기사를 분석하여 시장 동향이나 경쟁사 정보를 파악합니다.

장점

생산성 향상: 반복적이거나 시간이 많이 소요되는 작업을 자동화하여 효율성을 극대화합니다.
비용 절감: 특정 업무에 필요한 인력이나 자원을 줄일 수 있습니다.
새로운 가치 창출: 기존에는 불가능했거나 비효율적이었던 작업을 가능하게 하여 새로운 비즈니스 모델을 창출합니다.
개인화된 경험 제공: 사용자 개개인의 니즈에 맞는 맞춤형 서비스를 제공하여 만족도를 높입니다.

한계

환각(Hallucination): 사실이 아닌 정보를 그럴듯하게 생성하여 제공할 수 있습니다.
편향성: 학습 데이터에 존재하는 편향이 모델에 반영되어 차별적이거나 부적절한 결과를 초래할 수 있습니다.
최신 정보 부족: 학습 시점 이후의 최신 정보를 반영하지 못할 수 있습니다.
복잡한 추론의 한계: 아직까지는 인간 수준의 복잡한 논리적 추론이나 문제 해결 능력에는 한계가 있습니다.
데이터 보안 및 프라이버시: 민감한 정보를 다룰 때 데이터 유출이나 오용의 위험이 존재합니다.

크게 Finetuning 과 RAG 가 있다.

LLM 응용 전략

실제 서비스나 애플리케이션에 적용할 때 중요한 전략인 RAG(Retrieval-Augmented Generation), Fine-tuning, Agent에 대해 살펴보자

Fineturning
RAG
Agent

1. Fineturning

파인튜닝은 LLM 모델을 특별한 상황에 더 맞도록 훈련을 시키는 방법

Fine-tuning은 미리 학습된 LLM(Pre-trained LLM)을 특정 데이터셋(도메인 특화 데이터, 작업별 데이터, 지역 데이터 등)으로 추가 학습시키는 과정으로 이를 통해 모델의 파라미터를 조정하여 특정 작업이나 특정 도메인에 더욱 집중해서 성능을 발휘하도록 만드는 기술이다.

작동 방식:

사전 학습된 LLM 선택: GPT-3, Llama, BERT 등 이미 대량의 데이터로 학습된 LLM을 선택합니다.
데이터셋 준비: Fine-tuning에 사용할 고품질의 도메인 특화 데이터나 특정 작업에 대한 데이터를 준비합니다 (예: 질문-답변 쌍, 특정 스타일의 텍스트).
모델 추가 학습: 준비된 데이터셋으로 LLM을 추가적으로 학습시킵니다. 이 과정에서 모델의 가중치(파라미터)가 조정됩니다.
평가 및 배포: Fine-tuning된 모델의 성능을 평가하고, 실제 서비스에 배포합니다

<[1] 2단계에 걸치 파인튜닝 사례: https://floatbot.ai/tech/llm-fine-tuning-strategies>

전이학습

이렇게 한 분야 모델을 다른 분야를 학습시키는 것을 전이학습(Trasfer Learning)이라고 한다. 기존 학습한 모델의 내용이 다른 분야에도 전이된다는 의미로 이해한다.

<[2] 전이학습>

전이학습은 파인튜닝 보다 포괄적인 의미를 갖는다. 파인튜닝은 전이학습의 한 형태로 특정 분야, 특정 작업에 집중해 추가학습하는 과정을 말한다.

https://thebook.io/080413/0006/

파인 튜닝의 어려움

기존 모델에 추가 학습해야 하는데, 1) 어느 정도 데이터로 어느 정도 훈련해야 하는지 정하기 어렵다. 2) 학습에 과도한 비용이 발생, 즉 LLM 모델에 추가 학습에도 방대한 자원이 필요 3) 데이터 준비가 어렵다. 파인튜닝을 위해서 “질문-답변” 형식의 세트가 필요한데 새 데이터를 이렇게 준비하는게 쉽지 않다.

활용 예:

고객 상담 챗봇의 응대 방식 개선: 특정 기업의 고객 응대 매뉴얼, 과거 상담 기록으로 Fine-tuning하여 챗봇이 기업의 가이드라인과 톤앤매너에 맞게 응대하도록 합니다.
특정 분야 텍스트 생성: 의학 전문 기사를 작성하는 LLM을 만들기 위해 방대한 의학 논문으로 Fine-tuning합니다.
코드 생성 모델 개선: 특정 프로그래밍 언어나 특정 프레임워크의 코드 샘플로 Fine-tuning하여 해당 분야의 코드 생성 능력을 향상시킵니다.

파인 튜닝에 대한 자세한 OpenAI 문서

https://platform.openai.com/docs/guides/fine-tuning/preparing-your-dataset

2. RAG

RAG (Retrieval-Augmented Generation, 검색 증강 생성) 은 정보 검색과 생성을 결합한 인공지능 모델이다. RAG 는 복잡한 정보가 필요한 질문에 답변하기 위해 설계되었다. LLM의 ‘환각(Hallucination)’ 문제를 줄이고, 최신 정보나 특정 도메인의 전문 지식을 활용하게 하는 데 매우 효과적일 수 있다.

작동 방식:

사용자 질문: 사용자가 LLM에 질문을 합니다.
정보 검색: 질문과 관련된 정보를 외부 지식 소스(벡터 데이터베이스 등)에서 검색합니다. (이때 질문을 임베딩하여 유사한 임베딩을 가진 문서를 찾는 방식이 주로 사용됩니다.)
컨텍스트 추가: 검색된 관련 정보(문서 조각 등)를 사용자 질문과 함께 LLM의 프롬프트에 추가하여 전달합니다.
답변 생성: LLM은 추가된 컨텍스트를 기반으로 답변을 생성합니다.

RAG는 2단계로 구성된다. 정보검색 단계와 텍스트 생성 단계이다.

정보검색 단계
- 질문: 프롬프트 입력
- 쿼리: 문서 검색으로 데이터베이스, 문서 등의 콘텐츠 저장소에서 질문을 검색한다.
- 결과: 검색 결과중에서 관련성 높은 문서와 사용자 질문을 결합해서 LLM에 전달한다.
테스트 생성 단계
- 정보전달: 선택 문서 내용, 즉 사용자 질문 + 검색결과을 모델에 전달하면 LLM 모델이 의미를 이해하기 시작한다
- 텍스트 생성: 질문의 답변을 생성한다.

https://apmonitor.com/dde/index.php/Main/RAGLargeLanguageModel

활용예

기업 내부 지식 챗봇: 회사 규정, 제품 매뉴얼, 인사 정책 등 내부 문서를 학습시키지 않고, RAG를 통해 필요할 때 해당 문서에서 정보를 찾아 답변합니다.
법률 자문 시스템: 방대한 법조문 및 판례 데이터를 RAG에 연동하여 특정 사건에 대한 법률적 해석이나 관련 판례를 제시합니다.
뉴스 요약 및 분석: 실시간으로 업데이트되는 뉴스 기사를 RAG를 통해 검색하고, 사용자의 질문에 맞춰 요약하거나 분석합니다.

3. Agent

Agent는 LLM을 추론 엔진으로 활용하여, 특정 목표를 달성하기 위해 일련의 행동을 계획하고 실행하며, 필요시 도구를 사용하고 피드백을 받아 스스로 개선해나가는 시스템입니다. LLM은 단순히 텍스트를 생성하는 것을 넘어, 문제 해결을 위한 ‘두뇌’ 역할을 합니다.

작동 방식:

목표 설정: 사용자 또는 시스템이 에이전트에게 특정 목표를 부여합니다 (예: “다음 주 파리 여행 계획을 세워줘”).
계획 수립 (LLM의 추론): LLM은 목표를 달성하기 위한 단계별 계획을 세웁니다 (예: 항공권 검색 -> 호텔 예약 -> 관광지 조사 -> 예산 책정).
도구 사용: 계획에 따라 필요한 외부 도구(예: 항공권 예약 API, 구글 지도 API, 날씨 정보 API)를 호출하고 사용합니다.
관찰 및 피드백: 도구 사용 결과나 현재 상황을 관찰하고, 목표 달성에 얼마나 근접했는지 평가합니다.
반복 및 개선: 피드백을 바탕으로 다음 행동을 결정하거나, 필요시 계획을 수정하여 목표를 달성할 때까지 이 과정을 반복합니다.

4. 퓨샷, 제로샷 러닝

퓨샷러닝은 매우 적은 양의 데이터로 학습하는 능력을 말한다. 기존 모델에 매우 제한된 데이터로 부터 적응시키는 것이다.

퓨샷 러닝과 더불어 제로샷 러닝, 원샷 러닝들이 있다.

제로샷 러닝

기존 모델에 전혀 보지 못한 데이터가 제시되었을 때 예측을 수행할 수 있는 것을 제로샷 러닝이라고 한다.
- 기존 모델이 방대한 데이터를 바탕으로 추상화하고 일반화할 수 있는 능력이 필요

원샷 러닝

반면에 얼룩말 이미지 하나만 학습해서 얼룩말을 분류하는 것을 원샷 러닝이라고 한다 보통 지도학습 분야가 그렇다

퓨샷 러닝

또한 여러개의 얼룩말 이미지를 학습하고 얼룩말을 분류하는 것을 퓨샷러닝이라고 한다.

— 참고 —

LLM Fine-Tuning Strategies for Domain-Specific Applications
- https://floatbot.ai/tech/llm-fine-tuning-strategies
transfer learning
- https://brunch.co.kr/@harryban0917/283
- https://vitalflux.com/transfer-learning-vs-fine-tuning-differences/

2025-04-10 게시 됨2025-06-29 업데이트 됨AI / LLM28분안에 읽기 (약 4175 단어)

LLM01 - Models

대형언어모델에 대해서 간략이 정리한다.

언어모델(LM, Language Model)

https://brunch.co.kr/@brunchgpjz/49

통계적 언어모델 (SLM)
신경 언어모델 (NLM)
사전학습된 언어모델 (PLM)
- LSTM, biLSTM, ELMo. 그리고 Self-attention 을 갖춘 Transformer 아키텍처의 BERT
대규모 언어모델 (LLM)
- PLM의 확장(모델 크기, 데이터 크기) 하면 성능 향상

BERT

2018년 구글이 발표한 잔연어 처리 모델

BERT(Bidirectional Encoder Representations from Transformers)는 Google이 2018년에 발표한 언어 모델입니다. BERT는 텍스트 이해를 위해 주로 사용되며, 특히 텍스트의 양방향(contextual) 특성을 잘 이해하는 데 능력이 있습니다. BERT의 핵심 메커니즈다는 self-attention, 즉 자기 주의력이 있습니다.

Transformer 아키텍처

RNN 기반의 단점인 기억상실을 극복하고 self-attention 으로 문장 안의 단어 사이 관계 파악에 주력

Self-attention

문장 내의 모든 단어들에 대해 각각 중요도를 계산하고 특정 단어와 관련한 다른 단어들의 정보를 종합하는 방식을 통해서 문장의 문맥 속에서 단어의 의미를 더 정확히 파악할 수 있다.

Parallelize

RNN 과 달리 병렬로 계산해 속도 향상

사전학습

BERT는 라벨 없는 대규모 텍스트 데이터를 사전학습한다. 언어의 지식을 습득하고 다양한 NLP task 에 적용을 준비한다.

부호제거

BERT는 마스크한 언어모델 (Masked Language Model, MLM)과 다음 문장 예측(Next Sentence Prediction, NSP) 의 2가 방식으로 사전학습을 진행한다.

MLM
- 문장에서 일부 단어를 가리고 가려진 단어를 예측한다.
NSP
- 2개의 문장을 주어지면 두번째 문장이 첫번째 문장 다음 문장인지 판단하는 학습을 한다.

양방향 언어모델

문장의 양방향(앞, 뒤) 정보를 모두 활용하여 단어의 의미를 파악한다. 기존 모델들이 주로 단방향 또는 제한적인 양방향 정보만 활용했던 것에 비해 BERT는 문맥 정보를 활용해 높은 성능을 보여준다.

self-attention

self-attention은 BERT의 구조에서 중요한 역할을 합니다. 이는 각 단어에 대해 다른 모든 단어와의 관계를 평가하여 중요도를 계산합니다. 이를 통해 각 단어가 문맥 속에서 얼마나 중요한지, 다른 단어들과 어떻게 상호작용하는지를 파악할 수 있습니다.

BERT의 self-attention은 주로 두 가지로 구성됩니다:

Self-Attention Mechanism:
- BERT는 입력한 시퀀스에 대해 self-attention mechanism을 사용하여 각 단어의 의미를 계산합니다.
- 각 단어는 입력 시퀀스의 모든 단어에 대한 가중치를 계산하고, 그 가중치에 따라 다른 단어들로부터의 정보를 수집합니다.
- 이를 통해 각 단어가 문맥 내에서 어떻게 관련이 있는지 파악할 수 있습니다.
Multi-Head Attention:
- BERT는 여러 개의 attention head를 사용하여 더 복잡하고 다양한 관계를 포착할 수 있습니다.
- 각 attention head는 입력 시퀀스에 대해 독립적으로 작업을 수행하며, 서로 다른 기능을 가진 여러 attention matrix를 생성합니다.
- 이를 통해 모델이 다양한 관점에서 입력 텍스트를 이해할 수 있습니다.

self-attention의 구체적인 계산 과정은 다음과 같습니다:

Query, Key, Value:
- BERT는 입력 시퀀스를 Q(query), K(key), V(value)로 나누어 각 단어에 대해 attention을 계산합니다.
Attention Score Calculation:
- Q와 K를 Dot Product로 계산하여 attention score를 얻습니다.
- 이를 통해 각 단어가 다른 단어들과 얼마나 관련이 있는지를 평가합니다.
Attention Weight Calculation:
- Softmax 함수를 사용하여 attention score를 정규화하고, 이를 attention weight로 사용합니다.
Contextualized Embedding:
- 최종적으로 attention weight에 따라 다른 단어들로부터의 정보를 가중치하여, 각 단어의 contextualized embedding을 계산합니다.

이러한 과정을 통해 BERT는 입력 텍스트의 모든 단어가 문맥 내에서 어떻게 상호작용하는지를 이해하고, 이를 바탕으로 더 정교한 텍스트 이해를 가능하게 합니다.

BERT의 self-attention mechanism은 기존의 언어 모델들에 비해 텍스트 이해 및 시각화 능력이 더 뛰어나며, 이는 다양한 NLP 작업에서 높은 성능을 발휘하는 데 기여하고 있습니다.

날짜	모델	특징	비고
2024년 12월	DeepSeek-V3	- 6710억 개의 파라미터와 370억 개의 활성화된 파라미터 기반 MoE 모델	- 적은 비용으로 높은 성능을 달성하여 화제가 됨
2025년 1월	DeepSeek-R1	- 강화 학습 기반 추론 모델	- 높은 성능과 가성비로 주목받음
2025년 1월	DeepSeek-R1-Zero	- DeepSeek-R1 모델의 Zero 버전	- 추가 정보 필요

LLM 모델, 파라미터 별 비교

모델	개발사	파라미터 크기	주요 특징	활용 분야
Llama 1	Meta	7B, 13B, 33B, 65B	연구용, 제한적 공개	연구, 개발
Llama 2	Meta	7B, 13B, 70B	상업적 이용 가능, 다양한 기능 추가	챗봇, 텍스트 생성, 번역 등
Llama 3.1	Meta	8B, 70B, 405B	128k 컨텍스트, 8개 언어 지원, 도구 사용, Llama Guard 3 및 Prompt Guard 등 안전 도구 강화	챗봇, 텍스트 생성, 번역, 코딩, 수학 문제 해결 등
DeepSeek-V3	DeepSeek	671B	16-bit Transformer, MoE, dynamic biases	텍스트 생성, 코딩, 수학 문제 해결 등
DeepSeek-R1	DeepSeek	-	강화 학습 기반, 추론 특화	추론, 문제 해결
DeepSeek-R1-Distill	DeepSeek	1.5B, 7B, 8B, 14B, 32B, 70B	DeepSeek-R1 지식 증류, 다양한 크기 제공	추론, 문제 해결

Deepseek V3

딥시크-V3: 2024년 12월 공개된 LLM으로, 적은 비용으로 높은 성능을 달성하여 주목받았습니다.
딥시크-R1: 2025년 1월 공개된 추론 AI 모델로, 일부 성능 테스트에서 OpenAI의 모델을 능가하는 결과를 보여 화제가 되었습니다.

DeepSeek R1, 복잡한 아이디어 대신 단순한 RL 방식으로도 충분한 추론 성능 달성

DeepSeek R1은 복잡한 아이디어(DPO, MCTS) 대신 단순한 RL 방식으로도 충분한 추론 성능을 달성할 수 있음을 보여주는 대표적인 사례입니다.

기존 방식의 한계

DPO(Direct Preference Optimization)와 MCTS(Monte Carlo Tree Search)는 복잡한 계산 과정과 많은 자원을 필요로 합니다.

이러한 복잡성은 모델의 학습 속도를 늦추고, 대규모 모델에 적용하기 어렵다는 단점이 있습니다.

DeepSeek R1의 접근 방식

DeepSeek R1은 단순한 RL 알고리즘을 사용하여 추론 능력을 향상시켰습니다.

지도 학습 데이터 없이 순수 강화 학습만으로 모델을 학습시켜 추론 능력을 끌어올렸습니다.

자체 학습(Self-evolution) 과정을 통해 모델이 점진적으로 복잡한 추론 작업을 해결하는 능력을 개발했습니다.

Deepseek Timeline

2024년 9월 12일: o1-preview 출시
2024년 12월 5일: o1 정식 버전 및 o1-pro 출시
2024년 12월 20일: o3 발표 (ARC-AGI 통과, “AGI”로 주목받음)
2024년 12월 26일: DeepSeek V3 출시
2025년 1월 20일: DeepSeek R1 출시 (o1과 유사한 성능인데 오픈 소스)
2025년 1월 25일: 홍콩대학교 연구진이 R1 결과 복제 성공
2025년 1월 25일: Huggingface에서 R1을 복제한 완전 오픈소스 open-r1 프로젝트 발표
- https://huggingface.co/deepseek-ai

특징

DeepSeek v3는 Float8 E4M3, FP8 Master Accumulation, Latent Attention C Cache, Dynamic Biases for MoE 등 다양한 혁신적인 기술을 통해 높은 성능과 효율성을 동시에 달성했습니다.

DeepSeek v3 특징

E4M3 를 Float8 로 사용한다.
- Float8 중에서도 E4M3 형식을 사용하여 메모리 사용량을 줄이면서도 높은 정밀도를 유지합니다. 기존에는 E5M2 형식이 주로 사용되었지만, DeepSeek v3는 E4M3를 사용하여 연산 효율성을 높였습니다.
매 4번째 FP8 합산을을 마스터 FP32 accum 에 합산된다.
- DeepSeek v3는 매 4번째 FP8 누적 결과를 FP32 Master Accumulation에 더하여 정밀도를 향상시킵니다. 이는 FP8 연산의 단점을 보완하고 안정적인 학습을 가능하게 합니다.
Latent Attention stores C cache not KV cache
- Latent Attention의 Key(K)와 Value(V) 캐시 대신 C 캐시를 사용하여 메모리 사용량을 줄이고 연산 속도를 향상시킵니다. 이는 더욱 효율적인 Attention 연산을 가능하게 합니다.
No MoE loss balancing - dynamic biases instead
- 기존의 MoE Loss Balancing 대신 Dynamic Biases를 사용하여 모델의 균형을 맞추고 학습 효율성을 높입니다. 이는 더욱 안정적인 MoE 학습을 가능하게 합니다.

주요 기법

Float8 E4M3
- Float8 을 4비트 지수 (Exponent), 3비트 가수(Mantissa) 로 표현한다.
FP8 Master Accumulation
- FP8 연산 결과를 FP32 형식으로 누적하는 기술
Latency Attention
- Attension 으로 Latency Attention 으로 사용한다.
MoE ( Mixture of Experts)
- MoE 여러 개의 전문가 네트워크를 결합하여 성능을 향상시키는 기술, Dynamic Biases는 MoE의 각 전문가 네트워크에 동적으로 적용되는 편향(Bias)입니다.

LLM 기법 해설

전통 Attention 매커니즘

Attention 메커니즘은 인공지는 자연어 처리에서 문맥 속에서 중요한 정보를 선별하고 집중하여 처리함으로써 효율성을 높이는 기술이다.

https://jalammar.github.io/illustrated-transformer/

전통적 Attention 매커니즘 작동방식

유사도 계산 (Similarity Calculation)

입력된 각 단어(또는 토큰) 간의 유사도를 계산합니다. 이는 Query, Key, Value 벡터를 사용하여 수행됩니다.
- Query (Q): 질문 또는 현재 처리해야 할 정보를 나타내는 벡터
- Key (K): 입력 데이터의 각 단어(또는 토큰)를 나타내는 벡터
- Value (V): 입력 데이터의 각 단어(또는 토큰)의 실제 값을 나타내는 벡터
가중치 계산 (Weight Calculation)

계산된 유사도를 바탕으로 각 단어에 대한 가중치를 계산합니다. 이 가중치는 해당 단어가 얼마나 중요한지를 나타냅니다. Softmax 함수를 사용하여 가중치를 정규화합니다.
가중 평균 (Weighted Average)

계산된 가중치를 사용하여 입력 단어들의 가중 평균을 계산합니다. 이 가중 평균은 Attention 값을 나타냅니다.
출력 (Output)

계산된 Attention 값을 사용하여 최종 결과를 생성합니다.

토큰화한 단어 사이의 의미를 파악하기 위해 Sel-attention 을 Q, K, V 벡터로 수행한다.

https://www.linkedin.com/pulse/what-self-attention-impact-large-language-models-llm-nikhil-goel-srpbc/

Self-Attention

다양한 Attention 매커니즘

다양한 Attention 메커니즘 종류

Self-Attention

Self-Attention은 입력 시퀀스 내에서 각 요소들 간의 관계를 파악하는 데 사용되는 Attention 메커니즘입니다. Query, Key, Value가 모두 동일한 입력에서 파생된다는 특징을 가집니다.

작동 방식

Query, Key, Value 생성: 입력 시퀀스를 사용하여 Query, Key, Value 벡터를 생성합니다.
유사도 계산: Query와 Key 벡터 간의 유사도를 계산합니다.
가중치 계산: 계산된 유사도를 바탕으로 각 Key에 대한 가중치를 계산합니다.
가중 평균: 가중치를 사용하여 Value 벡터의 가중 평균을 계산합니다.
출력: 계산된 가중 평균을 Self-Attention의 출력으로 사용합니다.

특징

입력 시퀀스 내의 장거리 의존성을 효과적으로 파악할 수 있습니다.
병렬 처리가 가능하여 계산 효율성이 높습니다.

Multi-Head Attention

Multi-Head Attention은 Self-Attention을 여러 개의 head로 나누어 다양한 관점에서 입력 시퀀스를 분석하는 기법입니다.

각 head는 독립적으로 Self-Attention을 수행하고, 그 결과를 concat하여 최종 출력을 생성합니다.

작동 방식

입력 분할: 입력을 여러 개의 head로 나눕니다.
Self-Attention: 각 head에서 독립적으로 Self-Attention을 수행합니다.
결과 concat: 각 head의 출력 결과를 concat합니다.
출력: concat된 결과를 Multi-Head Attention의 출력으로 사용합니다.

특징

다양한 의미를 가진 정보를 효과적으로 추출할 수 있습니다.
모델의 표현력을 높여줍니다.

기타 Attention 메커니즘

Global Attention: 입력 시퀀스 전체를 사용하여 Attention 값을 계산합니다.
Local Attention: 입력 시퀀스의 특정 부분만 사용하여 Attention 값을 계산합니다.
Hierarchical Attention: 계층적인 구조를 가진 입력 데이터에 적용되는 Attention 메커니즘입니다.

전통 Attention 한계

전통적인 Attention 메커니즘은 계산 복잡도가 높고, 긴 시퀀스에 취약하다는 단점이 있습니다.

Offload

인공지능 LLM(Large Language Model) 분야에서 Offload는 특정 작업을 메인 프로세서(CPU 또는 GPU)에서 다른 보조 프로세서(GPU, TPU, NPU 등)로 이전하여 처리하는 것을 의미합니다.

Offload의 핵심 개념

작업 분산: LLM은 막대한 연산 능력을 요구하기 때문에, 하나의 프로세서만으로는 처리하기 어려울 수 있습니다. Offload는 이러한 문제를 해결하기 위해 작업을 여러 프로세서에 분산하여 처리합니다.
성능 향상: Offload를 통해 각 프로세서는 자신에게 특화된 작업을 효율적으로 처리할 수 있습니다. 이는 전체 시스템의 성능 향상으로 이어집니다.
자원 효율성: Offload는 시스템 자원을 효율적으로 활용할 수 있도록 도와줍니다. 예를 들어, CPU는 복잡한 연산을 처리하고, GPU는 병렬 연산에 특화된 작업을 처리하는 방식으로 자원을 분배할 수 있습니다.

Offload의 중요성

LLM의 효율적인 실행: LLM은 엄청난 크기의 모델과 데이터를 처리해야 합니다. Offload는 이러한 대규모 작업을 효율적으로 처리하는 데 필수적인 기술입니다.
추론 속도 향상: Offload를 통해 LLM의 추론 속도를 크게 향상시킬 수 있습니다. 이는 사용자 경험 개선에 중요한 역할을 합니다.
다양한 하드웨어 활용: Offload는 다양한 종류의 하드웨어를 활용하여 LLM을 실행할 수 있도록 도와줍니다. 이는 하드웨어 선택의 폭을 넓혀주고, 비용 효율적인 시스템 구축을 가능하게 합니다.

Offload의 활용 예시

GPU Offloading: LLM의 연산 중 많은 부분을 GPU로 Offload하여 처리합니다. GPU는 병렬 연산에 특화되어 있어 LLM의 연산 속도를 크게 향상시킬 수 있습니다.
TPU Offloading: Google에서 개발한 TPU(Tensor Processing Unit)는 LLM 연산에 특화된 하드웨어입니다. TPU Offloading을 통해 LLM의 성능을 극대화할 수 있습니다.
NPU Offloading: NPU(Neural Processing Unit)는 신경망 연산에 특화된 하드웨어입니다. NPU Offloading을 통해 LLM의 추론 속도를 더욱 빠르게 만들 수 있습니다.

결론

Offload는 인공지능 LLM의 효율적인 실행을 위한 핵심 기술입니다. Offload를 통해 LLM의 성능을 향상시키고, 다양한 하드웨어를 활용하여 LLM을 더욱 폭넓게 활용할 수 있습니다.

LLM 인퍼런스 훑어보기 (1) - LLM을 이용한 문장 생성

https://dytis.tistory.com/53?category=1139923

LLM 인퍼런스 훑어보기 (6) - quantization

https://dytis.tistory.com/60?category=1139923

— 참고 —

거대언어모델(LLM)의 현 주소

https://brunch.co.kr/@brunchgpjz/49

unsloth 의 양자화

Cool things from DeepSeek v3’s paper: https://x.com/danielhanchen/status/1872719599029850391
https://unsloth.ai/blog/deepseekr1-dynamic

DeepSeek

Korean LLM

https://huggingface.co/collections/spow12/korean-llm-66416dfe6b649b6aa331c4f8

LLM model Hosting

2025-02-02 게시 됨2025-03-06 업데이트 됨AI / LLM15분안에 읽기 (약 2177 단어)

Local LLM 실험: RTX 3080Ti 에서 bench mark 결과

RTX 3080TI 를 사용해서 LLM 모델 llama-bench 로 벤치마크 테스트를 수행했다.

llama-3-korean-bllossom-8B
llama-3.1-korean-reasoning-8B
UNIVA-Deepseek-llama3.1-Bllossom-8B
Deepseek-r1-distill-llama-8B
DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-32B

벤치마크 결과는 아래 테이블 같이 나온다.

model	size	params	backend	ngl	test	t/s
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	99	pp512	3730.08 ± 65.93
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	99	tg1000	91.75 ± 1.07

컬럼의 의미는 다음 같다.

Prompt processing (pp): processing a prompt in batches (-p)
Text generation (tg) :
n-gpu-layers (ngl) : GPU offload layers

llama-3-Korean-Bllossom-8B-Q4_K_M.gguf

8B 파라미터 크기를 가진 Llama3 fintuned 모델

MLP-KTLim/llama-3-Korean-Bllossom-8B-Q4_K_M.gguf

ngl 을 변경하며 벤치마킹,

1	llama-bench -m llama-3-Korean-Bllossom-8B-Q4_K_M.gguf -ngl 10,20,30,40,50 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	10	pp512	1303.36 ± 16.36
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	10	tg1000	10.85 ± 0.02
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	20	pp512	1719.75 ± 69.73
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	20	tg1000	16.87 ± 0.04
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	30	pp512	2906.49 ± 23.43
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	30	tg1000	39.91 ± 0.16
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	40	pp512	3483.66 ± 259.95
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	40	tg1000	89.85 ± 2.06
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	50	pp512	3419.22 ± 348.84
llama 8B Q4_K - Medium	4.58 GiB	8.03 B	CUDA	50	tg1000	89.79 ± 0.37

정리:

RTX3080TI 에서 ngl=40 개 정도에서 꽤, 쓸만하게 반응한다. (시간적으로)

lemon-mint/LLaMa-3.1-Korean-Reasoning-8B-Instruct-Q8

llama3.1-8B 는 32 layers 를 가진 모델이다.

여기서는 lemon-mint/llama-3.1-korean-reasoning-8b-instruct-q8_0.gguf 모델을 사용ㅇ했다.

1	llama-bench -m Bllossom/lemon-mint/llama-3.1-korean-reasoning-8b-instruct-q8_0.gguf -ngl 25,30,35,40,45

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	25	pp512	1784.23 ± 93.34
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	25	tg1000	14.80 ± 0.06
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	30	pp512	2786.34 ± 31.32
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	30	tg1000	26.87 ± 0.30
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	35	pp512	3733.38 ± 187.10
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	35	tg1000	73.87 ± 3.13
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	40	pp512	3797.38 ± 166.76
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	40	tg1000	74.09 ± 3.33
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	45	pp512	3791.58 ± 82.35
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	45	tg1000	74.12 ± 3.20

정리

RTX3080TI 는 8B 모델들은 적당히 잘 돌아 간다.
bllossom 8B 와 비슷하게 ngl=40 가 적당하다.

UNIVA-Deepseek-llama3.1-Bllossom-8B

DeepSeek-Bllossom Series는 기존 DeepSeek-R1-Distill Series 모델의 language mixing, 다국어 성능 저하 문제를 해결하기 위해 추가로 학습된 모델입니다.

DeepSeek-llama3.1-Bllossom-8B는 DeepSeek-R1-distill-Llama-8B 모델을 베이스로 구축된 모델로, 한국어 환경에서의 추론 성능 향상을 목표로 개발되었습니다.

mradermacher/DeepSeek-R1-Distill-Llama-8B_korean_reasoning-GGUF

6Bit

1	llama-bench -m UNIVA-DeepSeek-llama3.1-Bllossom-8B-Q6_K.gguf -ngl 20,23,25,27,30 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	20	pp512	1543.16 ± 24.32
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	20	tg1000	13.13 ± 0.11
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	23	pp512	1765.23 ± 58.73
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	23	tg1000	16.08 ± 0.07
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	25	pp512	2027.43 ± 43.47
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	25	tg1000	19.04 ± 0.30
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	27	pp512	2249.32 ± 57.11
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	27	tg1000	23.01 ± 0.82
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	30	pp512	3001.55 ± 29.89
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	30	tg1000	33.67 ± 0.20

1	(Deepseek_R1) qkboo:~$ llama-bench -m /mnt/e/LLM_Run/UNIVA-DeepSeek-llama3.1-Bllossom-8B-Q6_K.gguf -ngl 30,33,35,37,40 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	30	pp512	3011.60 ± 50.04
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	30	tg1000	34.08 ± 1.11
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	33	pp512	3895.08 ± 25.09
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	33	tg1000	76.81 ± 4.94
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	35	pp512	3933.71 ± 32.81
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	35	tg1000	77.27 ± 6.96
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	37	pp512	3883.86 ± 20.62
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	37	tg1000	77.30 ± 4.44
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	40	pp512	3909.77 ± 14.13
^[[C	llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	40	tg1000

8bit

1	$ llama-bench -m UNIVA-DeepSeek-llama3.1-Bllossom-8B-Q8_0.gguf -ngl 17,23,27,30,33 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	17	pp512	1152.58 ± 20.30
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	17	tg1000	8.79 ± 0.06
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	23	pp512	1653.79 ± 44.44
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	23	tg1000	12.79 ± 0.08
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	27	pp512	2170.69 ± 66.22
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	27	tg1000	18.02 ± 0.10
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	30	pp512	2997.54 ± 36.25
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	30	tg1000	26.93 ± 0.28
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	33	pp512	4311.76 ± 17.63
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	33	tg1000	80.54 ± 2.72

1	$ llama-bench -m /mnt/e/LLM_Run/UNIVA-DeepSeek-llama3.1-Bllossom-8B-Q8_0.gguf -ngl 47,53,57,60,65 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	47	pp512	4252.55 ± 170.94
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	47	tg1000	79.03 ± 8.48
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	53	pp512	4341.45 ± 181.79
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	53	tg1000	80.21 ± 8.60
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	57	pp512	4470.11 ± 27.91
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	57	tg1000	80.12 ± 6.18
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	60	pp512	4542.52 ± 23.46
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	60	tg1000	80.92 ± 9.37
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	65	pp512	4502.80 ± 57.29
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	65	tg1000	81.02 ± 10.89

DeepSeek-R1-Distill-Llama-8B-Q8_0.gguf

그 유명한 deepseek r1 으로 unsloth 의 distill 버전을 사용했다.

unsloth.ai/blog/deepseek-r1
https://unsloth.ai/blog/deepseekr1-dynamic
https://huggingface.co/unsloth/DeepSeek-R1-Distill-Llama-8B-GGUF

deepseek r1 은 61 layers 를 사용한다.

1 2	$ llama-bench -m DeepSeek-R1-Distill-Llama-8B-GGUF/DeepSeek-R1-Distill-Llama-8B-Q8_0.gguf -ngl 10,20,30 ,40,50 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	10	pp512	849.57 ± 12.77
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	10	tg1000	6.34 ± 0.06
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	20	pp512	1279.56 ± 22.85
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	20	tg1000	10.41 ± 0.08
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	30	pp512	2712.69 ± 96.48
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	30	tg1000	26.45 ± 0.42
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	40	pp512	3581.72 ± 261.82
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	40	tg1000	72.33 ± 1.53
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	50	pp512	3653.35 ± 292.75
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	50	tg1000	73.69 ± 2.39

정리

RTX3080TI 에서 ngl=40 에서 잘 반응한다.
역시 8B 파라미터라서 앞의 llama 3- bllossom, llama-3.1 8B 모델과 비슷하다.

DeepSeek-R1-Distill-Llama-8B_korean_reasoning

https://huggingface.co/mradermacher/DeepSeek-R1-Distill-Llama-8B_korean_reasoning-GGUF

6bit

1	$ llama-bench -m DeepSeek_R1_Distill/Llama-8B/DeepSeek-R1-Distill-Llama-8B_korean_reasoning.Q6_K.gguf -ngl 17,25,30,35,40,45 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	17	pp512	1420.67 ± 56.23
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	17	tg1000	10.87 ± 0.45
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	25	pp512	2126.29 ± 80.18
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	25	tg1000	18.29 ± 0.83
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	30	pp512	3136.95 ± 97.13
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	30	tg1000	33.18 ± 1.54
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	37	pp512	3670.82 ± 41.77
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	37	tg1000	77.20 ± 1.17
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	40	pp512	3711.66 ± 33.40
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	40	tg1000	77.59 ± 1.12
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	42	pp512	3725.29 ± 18.83
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	42	tg1000	77.39 ± 1.52
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	45	pp512	3690.92 ± 26.38
llama 8B Q6_K	6.14 GiB	8.03 B	CUDA	45	tg1000	77.49 ± 1.37

RTX3080ti 에서

pp 는 bllossom 버전보다 꽤 빠르다고 생각된다
tg 는 유사하다.
ngl은 40 정도가 적당할 듯.

8bit

l$ llama-bench -m DeepSeek_R1_Distill/Llama-8B/DeepSeek-R1-Distill-Llama-8B_korean_reasoning.Q8_0.gguf -ngl 25,29,35,39,42 -n 1000
ggml_cuda_init: GGML_CUDA_FORCE_MMQ: no
ggml_cuda_init: GGML_CUDA_FORCE_CUBLAS: no
ggml_cuda_init: found 1 CUDA devices:
Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	25	pp512	1811.10 ± 51.70
llama 8B Q8_0	7.95 GiB	8.03 B	CUDA	25	tg1000	14.25 ± 0.66
^C

RTX3080ti 에서

DeepSeek-R1-Distill-Qwen-14B

8bit Quantitization

1	$ llama-bench -m DeepSeek_R1_Distill/unsloth/DeepSeek-R1-Distill-Qwen-14B-Q8_0.gguf -ngl 25,28,30,33,35 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
qwen2 14B Q8_0	14.62 GiB	14.77 B	CUDA	25	pp512	649.52 ± 7.97
qwen2 14B Q8_0	14.62 GiB	14.77 B	CUDA	25	tg1000	4.73 ± 0.03
qwen2 14B Q8_0	14.62 GiB	14.77 B	CUDA	28	pp512	593.29 ± 188.35

6bit Quantitization

1	$ llama-bench -m DeepSeek_R1_Distill/unsloth/DeepSeek-R1-Distill-Qwen-14B-Q6_K.gguf -ngl 15,18,20,25,30 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
qwen2 14B Q6_K	11.29 GiB	14.77 B	CUDA	15	pp512	490.09 ± 191.57
qwen2 14B Q6_K	11.29 GiB	14.77 B	CUDA	15	tg1000	4.52 ± 0.04
qwen2 14B Q6_K	11.29 GiB	14.77 B	CUDA	18	pp512	629.45 ± 14.33
qwen2 14B Q6_K	11.29 GiB	14.77 B	CUDA	18	tg1000	4.93 ± 0.03
qwen2 14B Q6_K	11.29 GiB	14.77 B	CUDA	20	pp512	685.08 ± 14.48
qwen2 14B Q6_K	11.29 GiB	14.77 B	CUDA	25	pp512	787.79 ± 18.55

$ llama-bench -m DeepSeek_R1_Distill/unsloth/DeepSeek-R1-Distill-Qwen-14B-Q5_K_M.gguf -ngl 20,25
,30,35 -n 1000
ggml_cuda_init: GGML_CUDA_FORCE_MMQ: no
ggml_cuda_init: GGML_CUDA_FORCE_CUBLAS: no
ggml_cuda_init: found 1 CUDA devices:
Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
qwen2 14B Q5_K - Medium	9.78 GiB	14.77 B	CUDA	20	pp512	735.40 ± 7.36
qwen2 14B Q5_K - Medium	9.78 GiB	14.77 B	CUDA	20	tg1000	5.74 ± 0.12
qwen2 14B Q5_K - Medium	9.78 GiB	14.77 B	CUDA	25	pp512	829.91 ± 7.98
qwen2 14B Q5_K - Medium	9.78 GiB	14.77 B	CUDA	25	tg1000	6.77 ± 0.16
^C

DeepSeek-R1-Distill-Qwen-32B

320만개 파라미터를 가진 Deepssek 와 Qwen-32B 를 distill 한 버전이다.

unsloth/DeepSeek-R1-Distill-Qwen-32B-Q3
unsloth/DeepSeek-R1-Distill-Qwen-32B-Q2

DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf

1	$ llama-bench -m unsloth/DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf -ngl 27,30,33,35 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
qwen2 32B Q3_K - Medium	14.84 GiB	32.76 B	CUDA	27	pp512	392.53 ± 2.94
qwen2 32B Q3_K - Medium	14.84 GiB	32.76 B	CUDA	27	tg1000	3.76 ± 0.02
qwen2 32B Q3_K - Medium	14.84 GiB	32.76 B	CUDA	30	pp512	411.41 ± 4.29
qwen2 32B Q3_K - Medium	14.84 GiB	32.76 B	CUDA	30	tg1000	4.04 ± 0.02
qwen2 32B Q3_K - Medium	14.84 GiB	32.76 B	CUDA	33	pp512	362.17 ± 93.15
qwen2 32B Q3_K - Medium	14.84 GiB	32.76 B	CUDA	33	tg1000	4.11 ± 0.01
qwen2 32B Q3_K - Medium	14.84 GiB	32.76 B	CUDA	35	pp512	427.65 ± 24.95
qwen2 32B Q3_K - Medium	14.84 GiB	32.76 B	CUDA	35	tg1000	4.44 ± 0.05

정리

8B 모델 대비 확실히 1/10로 반응시간이 느려졌다. 그래서 실행해서 프롬프트 테스트하기 버겁다.
ngl 당 걸린 시간이 너무 오래 걸린다. 측정을 못했지만 20분 이상 걸리는 것 같다.

DeepSeek-R1-Distill-Qwen-32B-Q2_K.gguf

1	$ llama-bench -m DeepSeek_R1_Distill/unsloth/DeepSeek-R1-Distill-Qwen-32B-Q2_K.gguf -ngl 25,28,30,33,35 -n 1000

Device 0: NVIDIA GeForce RTX 3080 Ti, compute capability 8.6, VMM: yes

model	size	params	backend	ngl	test	t/s
qwen2 32B Q2_K - Medium	11.46 GiB	32.76 B	CUDA	25	pp512	360.50 ± 104.74
qwen2 32B Q2_K - Medium	11.46 GiB	32.76 B	CUDA	25	tg1000	4.49 ± 0.07
qwen2 32B Q2_K - Medium	11.46 GiB	32.76 B	CUDA	28	pp512	422.67 ± 6.60
qwen2 32B Q2_K - Medium	11.46 GiB	32.76 B	CUDA	28	tg1000	4.83 ± 0.03
qwen2 32B Q2_K - Medium	11.46 GiB	32.76 B	CUDA	30	pp512	466.25 ± 3.99

정리

320만개 파라미터는 RTX3080TI 에서 무리이다.
80만개 파라미터를 가진 모델은 돌릴만 하다.

RTX 3080Ti 에서 적절한 ngl 표.

model	size	params	backend	ngl	test	t/s
llama3-Korean-Bllossom-8B-Q4_K	4.58 GiB	8.03 B	CUDA	40	pp512	3483.66 ± 259.95
llama3-Korean-Bllossom-8B-Q4_K	4.58 GiB	8.03 B	CUDA	40	tg1000	89.85 ± 2.06
llama-3.1-korean-reasoning-8b-instruct-q8_0	7.95 GiB	8.03 B	CUDA	35	pp512	3733.38 ± 187.10
llama-3.1-korean-reasoning-8b-instruct-q8_0	7.95 GiB	8.03 B	CUDA	35	tg1000	73.87 ± 3.13

2025-02-01 게시 됨2025-02-12 업데이트 됨AI / LLM한 시간안에 읽기 (약 7383 단어)

Local LLM 실험: DeepSeek-R1-Distill-Llama-8B, RTX 3080 TI

RTX 3080TI 를 사용해서 LLM 모델을 Local 로 돌려보고 있다.

wikidoc 의 https://wikidocs.net/226033 질문지와 2~3개 질문을 추가해서 진행했다.

시스템 사양

AMD Ryzen 7 5800X3D
RAM 64GB
RTX 3080 TI

DeepSeek-R1-Distill-Llama-8B-F16.gguf

https://huggingface.co/unsloth/DeepSeek-R1-Distill-Llama-8B-GGUF

로딩에 약20분 소요되어 보인다.

누구?

질문:

누구냐 너

1
2
3

네, 네가 말하는 "누구냐 너"은 "누구냐? 네"라는 문구를 질문하는 것이다. 이는“你是谁呢？”或者“你是谁？”라고翻译할 수 있다.

어떻게 해도 네가 대답할 수 있는 만큼, 네가 네 자신을 소개할 수 있을지 모르겠어. 네가 원하는 대로 대답해봐! 😊

처리:

slot update_slots: id  0 | task 0 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 13
slot update_slots: id  0 | task 0 | kv cache rm [0, end)
slot update_slots: id  0 | task 0 | prompt processing progress, n_past = 13, n_tokens = 13, progress = 1.000000
slot update_slots: id  0 | task 0 | prompt done, n_past = 13, n_tokens = 13
slot      release: id  0 | task 0 | stop processing: n_past = 103, truncated = 0
slot print_timing: id  0 | task 0 |
prompt eval time =     676.56 ms /    13 tokens (   52.04 ms per token,    19.21 tokens per second)
       eval time =   35787.96 ms /    91 tokens (  393.27 ms per token,     2.54 tokens per second)
      total time =   36464.52 ms /   104 tokens

질문:

1	니가 이해할 수 있는 언어는 어떠 언어들이야?

답:

니가 이해할 수 있는 언어는 영어, 한국어, 중국어, 일본어, 그리고 여러 가지 다른 언어와方言을 이해할 수 있습니다. 무슨 언어로 도와드리겠습니다か이겠어요? 😊

처리:

slot update_slots: id  0 | task 92 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 116
slot update_slots: id  0 | task 92 | kv cache rm [13, end)
slot update_slots: id  0 | task 92 | prompt processing progress, n_past = 116, n_tokens = 103, progress = 0.887931
slot update_slots: id  0 | task 92 | prompt done, n_past = 116, n_tokens = 103
slot      release: id  0 | task 92 | stop processing: n_past = 370, truncated = 0
slot print_timing: id  0 | task 92 |
prompt eval time =    1442.26 ms /   103 tokens (   14.00 ms per token,    71.42 tokens per second)
       eval time =   99349.69 ms /   255 tokens (  389.61 ms per token,     2.57 tokens per second)
      total time =  100791.95 ms /   358 tokens

질문:

1	너는 한국어 이해하니?

답:

1
2
3

네, 한국어를 이해하고 있습니다! 😊

네, 도와드리겠습니다. 원하는 대로 만들어드리겠습니다.

처리:

slot update_slots: id  0 | task 1200 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 466
slot update_slots: id  0 | task 1200 | kv cache rm [421, end)
slot update_slots: id  0 | task 1200 | prompt processing progress, n_past = 466, n_tokens = 45, progress = 0.096567
slot update_slots: id  0 | task 1200 | prompt done, n_past = 466, n_tokens = 45
slot      release: id  0 | task 1200 | stop processing: n_past = 733, truncated = 0
slot print_timing: id  0 | task 1200 |
prompt eval time =    1475.86 ms /    45 tokens (   32.80 ms per token,    30.49 tokens per second)
       eval time =  103316.40 ms /   268 tokens (  385.51 ms per token,     2.59 tokens per second)
      total time =  104792.25 ms /   313 tokens

데이터

질문:

1	언제까지의 데이터를 학습했지?

답:

The AI, in this case, appears to be capable of understanding and responding in multiple languages, including Korean, English, Chinese, and Japanese, among others. It can also handle various dialects and slang, which suggests it has been trained on a significant dataset covering these languages and their variations. However, the exact number of languages it can process and the size of the dataset are not explicitly stated.

The AI's ability to switch languages based on the user's input indicates that it dynamically adjusts its response to the language used. This likely involves real-time language detection and processing, rather than pre-programmed responses for each language.

Regarding the technology behind the AI, it is likely utilizing neural networks, which are a common approach for natural language processing tasks. The complexity of these networks can vary, and without specific information, it's hard to determine the exact architecture.

In summary, the AI seems to have been trained on a comprehensive dataset covering multiple languages and dialects, enabling it to understand and respond in various languages. The technology behind it probably includes neural networks, allowing it to adapt to different inputs and provide a wide range of responses.

처리:

slot update_slots: id  0 | task 348 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 177
slot update_slots: id  0 | task 348 | kv cache rm [116, end)
slot update_slots: id  0 | task 348 | prompt processing progress, n_past = 177, n_tokens = 61, progress = 0.344633
slot update_slots: id  0 | task 348 | prompt done, n_past = 177, n_tokens = 61
slot      release: id  0 | task 348 | stop processing: n_past = 752, truncated = 0
slot print_timing: id  0 | task 348 |
prompt eval time =    1490.37 ms /    61 tokens (   24.43 ms per token,    40.93 tokens per second)
       eval time =  223929.58 ms /   576 tokens (  388.77 ms per token,     2.57 tokens per second)
      total time =  225419.94 ms /   637 tokens

창조능력

질문:

1	'고구마'로 삼행시를 지어줘

1
2
3

고구마로 삼행시를 지어주는 데 도와드리겠습니다! 😊

네, 도와드리겠습니다. 원하는 대로 만들겠습니다.

slot update_slots: id  0 | task 925 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 421
slot update_slots: id  0 | task 925 | kv cache rm [177, end)
slot update_slots: id  0 | task 925 | prompt processing progress, n_past = 421, n_tokens = 244, progress = 0.579572
slot update_slots: id  0 | task 925 | prompt done, n_past = 421, n_tokens = 244
slot      release: id  0 | task 925 | stop processing: n_past = 694, truncated = 0
slot print_timing: id  0 | task 925 |
prompt eval time =    1648.24 ms /   244 tokens (    6.76 ms per token,   148.04 tokens per second)
       eval time =  108852.54 ms /   274 tokens (  397.27 ms per token,     2.52 tokens per second)
      total time =  110500.79 ms /   518 tokens

끝말잇기

질문:

1
2
3

끝말잇기를 하자. 내가 먼저 할게.

기차

답:

1
2
3

끝말잇기를 하자. 내가 먼저 할게.

기차

처리:

slot update_slots: id  0 | task 1469 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 512
slot update_slots: id  0 | task 1469 | kv cache rm [466, end)
slot update_slots: id  0 | task 1469 | prompt processing progress, n_past = 512, n_tokens = 46, progress = 0.089844
slot update_slots: id  0 | task 1469 | prompt done, n_past = 512, n_tokens = 46
slot      release: id  0 | task 1469 | stop processing: n_past = 784, truncated = 0
slot print_timing: id  0 | task 1469 |
prompt eval time =    1568.28 ms /    46 tokens (   34.09 ms per token,    29.33 tokens per second)
       eval time =  105810.17 ms /   273 tokens (  387.58 ms per token,     2.58 tokens per second)
      total time =  107378.45 ms /   319 tokens

문제 만들기1

질문:

1	초등 국어 문제 3개 만들어줘, 힌트 정답 해설 포함

답:

Elementary Korean Questions with Hints and Answers

How many apples can you count?
- Hint: Count the apples one by one and put each one on the other side of the table.
- Answer: There are 5 apples.
What color is the cat?
- Hint: Look at the cat sitting on the chair in the living room. The color of its fur will help you.
- Answer: The cat is brown.
What is the name of the dog?
- Hint: Notice what kind of animal the dog is and what it’s doing. The name of the dog will help you find the answer.
- Answer: The dog is called Max.

These questions are designed to assess basic comprehension and vocabulary skills in Korean, suitable for elementary-level students. Each question includes a hint to guide students toward the correct answer, ensuring a clear and structured learning experience.

처리:

slot update_slots: id  0 | task 1743 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 551
slot update_slots: id  0 | task 1743 | kv cache rm [512, end)
slot update_slots: id  0 | task 1743 | prompt processing progress, n_past = 551, n_tokens = 39, progress = 0.070780
slot update_slots: id  0 | task 1743 | prompt done, n_past = 551, n_tokens = 39
slot      release: id  0 | task 1743 | stop processing: n_past = 1482, truncated = 0
slot print_timing: id  0 | task 1743 |
prompt eval time =    1869.56 ms /    39 tokens (   47.94 ms per token,    20.86 tokens per second)
       eval time =  360229.58 ms /   932 tokens (  386.51 ms per token,     2.59 tokens per second)
      total time =  362099.14 ms /   971 tokens

문제만들기2

질문:

1	고등학교 지구과학 문제 3개를 만들어져, 힌트, 정답과 해설을 포함해줘

답:

고등학교 지구과학 문제 3개

역사적河流
- 힌트: 가장 긴河流이 한 강으로,黄海로 흐르는 강입니다.
- 정답: 한 강
- 해설: 한 강은 한국에서 가장 긴河流로,黃海에 흐르는重要河流입니다.
기후帯
- 힌트: 아마존 기름림은 적도 주변에 있습니다.
- 정답: 열대 기후帯
- 해설: 아마존 기름림은 열대 기후帯에 속한 지역으로, 강렬한 비雨과热帯적인气候를 특징으로 합니다.
州 수도
- 힌트: 콜로라도 주의 남중부에 위치한 도시입니다.
- 정답: 덴버
- 해설: 덴버는 콜로라도 주의 수도이며, 고산 지대로서 높은 해拔을 가지고 있습니다.

이 세 문제는 고등학교 지구과학 학생들을 위한适合한 문제입니다.各문제는 지리적 특征과 학생들의지식 수준에 맞춘内容로,힌트와 해설을 통해 문제 해결을 안내합니다.

처리:

slot launch_slot_: id  0 | task 2676 | processing task
slot update_slots: id  0 | task 2676 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 778
slot update_slots: id  0 | task 2676 | kv cache rm [551, end)
slot update_slots: id  0 | task 2676 | prompt processing progress, n_past = 778, n_tokens = 227, progress = 0.291774
slot update_slots: id  0 | task 2676 | prompt done, n_past = 778, n_tokens = 227
slot      release: id  0 | task 2676 | stop processing: n_past = 1634, truncated = 0
slot print_timing: id  0 | task 2676 |
prompt eval time =    1478.08 ms /   227 tokens (    6.51 ms per token,   153.58 tokens per second)
       eval time =  330115.05 ms /   857 tokens (  385.20 ms per token,     2.60 tokens per second)
      total time =  331593.13 ms /  1084 tokens

판단

질문:

1	철수는 하루에 치킨 100마리를 튀기고 민수는 하루에 치킨 60마리를 튀긴다. 누가 더 일을 잘하지?

답:

철수는 하루에 치킨 100마리를 튀기고 민수는 하루에 치킨 60마리를 튀기고 있습니다. 철수는 더 많은 마리를 튀기고 있습니다. 따라서 철수는 민수보다 더 많은 일을 하거나 더 나은 효율을 가지고 있습니다.

철수는 더 많은 일을 하고 있습니다.

처리:

slot update_slots: id  0 | task 3534 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 1108
slot update_slots: id  0 | task 3534 | kv cache rm [778, end)
slot update_slots: id  0 | task 3534 | prompt processing progress, n_past = 1108, n_tokens = 330, progress = 0.297834
slot update_slots: id  0 | task 3534 | prompt done, n_past = 1108, n_tokens = 330
slot      release: id  0 | task 3534 | stop processing: n_past = 1479, truncated = 0
slot print_timing: id  0 | task 3534 |
prompt eval time =    1479.34 ms /   330 tokens (    4.48 ms per token,   223.07 tokens per second)
       eval time =  145504.30 ms /   372 tokens (  391.14 ms per token,     2.56 tokens per second)
      total time =  146983.64 ms /   702 tokens

문장 교정

질문:

1
2
3

다음 텍스트를 자연스럽게 교정해 줘.

이번 장에서 여러분은 커널을 디버깅을 하는 데 있어 여러 가지 접근 방법이 있다는 것을 배웠다. 우리는 어떤 상황에서 어떤 접근 방법을 사용해야 할지 빠르게 결정할 수 있도록 그런 접근 방법들을 분류도 해봤다. 모든 도구 혹은 기법이 모든 시나리오 혹은 상황에 도움이 되지 않는다는 것이 핵심 포인트 중 하나다. 예를 들어서 KASAN 같은 강력한 메모리 체커는 개발 단계 및 유닛 테스트 단계에서는 정말 유용하지만 시스템 테스트나 제품화 단계에서는 일반적으로 사용이 불가능 하다 (다(프로덕션 커널은 디버그 커널과 달리 KASAN 사용이 비활성화 되도록 환경 설정이 되기 때문이다.)

답:

In this chapter, you’ve learned about various methods for debugging the kernel. We classified these methods to help you quickly decide which method to use in different situations. One key point is that not all tools or techniques are useful in every scenario. For example, a strong memory checker like KASAN is very useful in the development phase and unit test phase, but is generally not used in the system test or product phase. This is because, unlike debug kernels, in production kernels, KASAN is disabled due to environment settings.

처리:

slot update_slots: id  0 | task 3907 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 1383
slot update_slots: id  0 | task 3907 | kv cache rm [1108, end)
slot update_slots: id  0 | task 3907 | prompt processing progress, n_past = 1383, n_tokens = 275, progress = 0.198843
slot update_slots: id  0 | task 3907 | prompt done, n_past = 1383, n_tokens = 275
slot      release: id  0 | task 3907 | stop processing: n_past = 2574, truncated = 0
slot print_timing: id  0 | task 3907 |
prompt eval time =    1380.52 ms /   275 tokens (    5.02 ms per token,   199.20 tokens per second)
       eval time =  473219.25 ms /  1192 tokens (  397.00 ms per token,     2.52 tokens per second)
      total time =  474599.77 ms /  1467 tokens

영문 번역

질문:

1
2
3

We both worked with young moms who go completely dark for a few hours in the evening, when they are with their families and putting their kids to bed.

위 문장을 한국어로 번역해

답:

We both worked with young moms who go completely dark for a few hours in the evening, when they are with their families and putting their kids to bed.

처리:

slot update_slots: id  0 | task 5100 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 1532
slot update_slots: id  0 | task 5100 | kv cache rm [1383, end)
slot update_slots: id  0 | task 5100 | prompt processing progress, n_past = 1532, n_tokens = 149, progress = 0.097258
slot update_slots: id  0 | task 5100 | prompt done, n_past = 1532, n_tokens = 149
slot      release: id  0 | task 5100 | stop processing: n_past = 1936, truncated = 0
slot print_timing: id  0 | task 5100 |
prompt eval time =    1779.25 ms /   149 tokens (   11.94 ms per token,    83.74 tokens per second)
       eval time =  161435.15 ms /   405 tokens (  398.61 ms per token,     2.51 tokens per second)
      total time =  163214.40 ms /   554 tokens

명령 에러 처리

질문:

1	crontab -e 명령 실행 시에만 E319: Sorry, the command is not available in this version 메시지가 나온다.

답:

To address the issue of the crontab -e command not working, follow these steps:

Identify the Cron Version: Determine which cron implementation you are using by typing crontab -V or man cron. This will inform you if you’re using GNU cron or another implementation.
Check for -e Option Support: If the -e option isn’t available, note that different cron versions may support different commands or have variations in their syntax.
Use an Alternative Text Editor:
- Open the crontab file with a text editor like vim.
- Ensure you have the necessary permissions to edit the file. If not, use sudo to gain root privileges.
Modify the Cron File Directly:
- Edit the crontab file located at /etc/crontab or /usr/etc/crontab.
- Make the desired changes and save the file.
Alternative Commands:
- Use the at command with specific intervals, such as @hourly, to schedule tasks if crontab -e isn’t available.
- Explore graphical tools like crontab-gui for an easier interface to manage cron schedules.
Verify Cron Implementation:
- If you’re using dcron, note that its behavior and commands may differ from crontab.
Manual Editing as a Last Resort:
- Back up the crontab file.
- Remove the existing file and recreate it with the necessary entries, ensuring the correct format.

By following these steps, you can effectively edit your cron table even if the crontab -e command isn’t available.

처리:

slot update_slots: id  0 | task 5506 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 1597
slot update_slots: id  0 | task 5506 | kv cache rm [1532, end)
slot update_slots: id  0 | task 5506 | prompt processing progress, n_past = 1597, n_tokens = 65, progress = 0.040701
slot update_slots: id  0 | task 5506 | prompt done, n_past = 1597, n_tokens = 65
slot      release: id  0 | task 5506 | stop processing: n_past = 2596, truncated = 0
slot print_timing: id  0 | task 5506 |
prompt eval time =    1354.27 ms /    65 tokens (   20.83 ms per token,    48.00 tokens per second)
       eval time =  394077.31 ms /  1000 tokens (  394.08 ms per token,     2.54 tokens per second)
      total time =  395431.58 ms /  1065 tokens

지명과 특산물

질문:

다음 지문을 읽고 문제에 답하시오.

---

1950년 7월, 한국 전쟁 초기에 이승만 대통령은 맥아더 장군에게 유격대원들을 북한군의 후방에 침투시키는 방안을 제안했다. 이후, 육군본부는 육본직할 유격대와 육본 독립 유격대를 편성했다. 국군은 포항과 인접한 장사동 지역에 상륙작전을 수행할 부대로 독립 제1유격대대를 선정했다. 육군본부는 독립 제1유격대대에 동해안의 장사동 해안에 상륙작전을 감행하여 북한군 제2군단의 보급로를 차단하고 국군 제1군단의 작전을 유리하게 하기 위한 작전명령(육본 작명 제174호)을 하달했다. 9월 14일, 독립 제1유격대대는 부산에서 LST 문산호에 승선하여 영덕군의 장사동으로 출항했다.

1950년 9월 15일, 독립 제1유격대대는 장사동 해안에 상륙을 시도하였으나 태풍 케지아로 인한 높은 파도와 안개로 인해 어려움을 겪었다. LST 문산호는 북한군의 사격과 파도로 인해 좌초되었고, 상륙부대는 09:00시경에 전원이 상륙을 완료하였다. 그 후, 15:00시경에 200고지를 점령하였고, 다양한 무기와 장비를 노획하였다. 9월 16일과 17일에는 독립 제1유격대대가 여러 위치에서 북한군과의 전투를 벌였으며, 미 구축함과의 연락 두절로 인해 추가적인 어려움을 겪었다.

장사동에서 위급한 상황에 처한 독립 제1유격대대를 구출하기 위해 해군본부는 LT-1(인왕호)를 급파했으나, LST 문산호의 구출에 실패했다. 해군본부는 상륙부대의 철수를 지원하기 위해 LST 조치원호를 현지로 보냈다. 9월 18일, 이명흠 부대장은 유엔 해군과의 협력 하에 부족한 식량과 탄약 지원을 받았다. 9월 19일, 유엔군의 함포지원과 함께 LST 조치원호가 도착하여 철수 작전을 시작했다. 스피어 소령은 직접 해안에 상륙하여 구조작전을 지시하였다. 9월 20일, 725명이 부산항으로 복귀했으나, 32명이 장사동 해안에 남아 북한군의 포로가 되었거나 탈출하여 국군에 합류하였다.

장사리 전투가 인천 상륙작전의 양동작전으로 알려졌으나, 이 전투가 드라마틱한 요소로 인해 과장되었으며, 실제로는 인천 상륙작전과 큰 관련이 없다. 또한, 북한이나 중국의 군사적 상황을 고려할 때, 장사리에서의 전투가 낙동강 전선에 영향을 끼칠 가능성은 낮다.

---

문제
1. 지문에 나오는 지명을 모두 쓰시오.
2. 그중 대게로 유명한 곳은?

답:

Question 1: List of Places Mentioned

포항 (Pohang)
장사동 (Jinseong-dong)
영덕군 (Yangju-gun)
북한군 제2군단 (North Korean 2nd Corps)
미 구축함 (U.S. military vessels)
해군본부 (Naval Headquarters)
스피어 소령 (Spear Colonel)
부산항 (Busan Port)
낙동강 (Nakdong River)
인천 상륙작전 (Incheon Landing Operation)

Question 2: Notable Place

The most notable place mentioned, considering the broader context of the Korean War, is 인천 상륙작전 (Incheon Landing Operation). This operation is globally recognized as a significant turning point in the war. However, if focusing specifically on the Jinseong-dong operations detailed in the text, 장사동 (Jinseong-dong) would be the main location of discussion.

처리:

slot update_slots: id  0 | task 6530 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 2739
slot update_slots: id  0 | task 6530 | kv cache rm [2708, end)
slot update_slots: id  0 | task 6530 | prompt processing progress, n_past = 2739, n_tokens = 31, progress = 0.011318
slot update_slots: id  0 | task 6530 | prompt done, n_past = 2739, n_tokens = 31
slot      release: id  0 | task 6530 | stop processing: n_past = 3826, truncated = 0
slot print_timing: id  0 | task 6530 |
prompt eval time =    1578.84 ms /    31 tokens (   50.93 ms per token,    19.63 tokens per second)
       eval time =  445367.25 ms /  1088 tokens (  409.34 ms per token,     2.44 tokens per second)
      total time =  446946.09 ms /  1119 tokens

강수량과 그 영향

질문:

1	겨울철 강수량이 그 다음 해의 농수산물 수확량에 미치는 영향은?

답:

겨울철 강수량이 그 다음 해의 농수산물 수확량에 미치는 영향은, 여러 가지因素에 따라 달리ます. 특히, 강수량의 양과 타이밍, 특정 작物에 대한 민감도, 지역 간 차이, 농업 기법, 정부 정책,以及長期 기후 추이 등이 중요한要素입니다.

강수양과 타이밍:
- 过量 강수는-waterlogging-을 일으켜 작물에 손상을 주거나, 전기 재배에 도움이 되지 않아 다음 해의 수확량을 감소할 수 있습니다.
- 조금 강수는, 토양으로부터 물을 공급해 작물을 도와줍니다.
- 이른 강수는, 작물을 심은 전에 발생해, 다음 해의 재배에 영향을 미칠 수 있습니다.
작물 특성:
- 대규모 작물如 쌀은, 강수량에 매우 민감합니다. 강수가 과도한 경우, 쌀의 수확을 크게 감소할 수 있습니다.
- 작물에 따른 차이는, 강수에 대한 민감도가 차이가 있습니다. 보리,맥아 등은 강수에 상대적으로 강해, 수확량을 덜 영향을 받을 수 있습니다.
지역 간 차이:
- 북부 지역에서, 강설은 특히 많이 내려, 작물에 무게가 되거나, 기근으로 작물 성장에 어려움을 주는 데 기여할 수 있습니다.
- 남부 지역에서는, 강수량이 적을 수 있습니다.
농업 기법:
- 조도 기법과 ** 灌漑 기법**은, 강수를 관리하는 데 도움을 줄 수 있습니다.
- 기술적 도움은, 강수에 대한適応을 이끌어 내는 데 기여할 수 있습니다.
정부 정책:
- 정부는, 농업을 지지하는 정책을 통해, 강수에 대한 영향을 완화하는 데 도움을 줄 수 있습니다.
- 예를 들어,农장지대와水리 기관을 개선하는 정책은, 강수에 대한 내성을 높일 수 있습니다.
長期 기후 추이:
- 기후 변화로 인해, 강수 양과 패턴이 바뀌고 있습니다. 이는, 농업에 대한 영향도 변해나갈 수 있습니다.
역사적 연구와 통계자료:
- 역사적 데이터나 연구를 통해, 강수량과 수확량의 관계를 분석할 수 있습니다. 이는,具体한 지역이나 작물에 대한详细한 통찰을 제공할 수 있습니다.
기술적 도움:
- 현대 농업 기법, 예를 들어滴灌과정밀 농업은, 강수에 대한适응을 도와주며, 수확량을 향상시킬 수 있습니다.

결론:
겨울철 강수량이 다음 해의 농수산물 수확량에 미치는 영향은, 강수양, 타이밍, 작물 특性, 지역 간 차이, 농업 기법, 정부 정책,以及 기후 변화에 의해 다양하게 나타납니다. 이를 이해하기 위해,역사적 데이터,政府 보고서, 농업 통계자료 등을 통해,详细한 분석을 진행할 필요があります.

처리:

slot update_slots: id  0 | task 7619 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 3011
slot update_slots: id  0 | task 7619 | kv cache rm [2739, end)
slot update_slots: id  0 | task 7619 | prompt processing progress, n_past = 3011, n_tokens = 272, progress = 0.090335
slot update_slots: id  0 | task 7619 | prompt done, n_past = 3011, n_tokens = 272
slot update_slots: id  0 | task 7619 | slot context shift, n_keep = 1, n_left = 4094, n_discard = 2047
slot      release: id  0 | task 7619 | stop processing: n_past = 2452, truncated = 1
slot print_timing: id  0 | task 7619 |
prompt eval time =    1373.10 ms /   272 tokens (    5.05 ms per token,   198.09 tokens per second)
       eval time =  595671.60 ms /  1489 tokens (  400.05 ms per token,     2.50 tokens per second)
      total time =  597044.70 ms /  1761 tokens

라니냐 발생 가능성

질문:

1	2024년 겨울에 라니냐가 발생할 수 있을것 같아?

답:

2024년 겨울에 라니냐(La Niña)가 발생할 수 있는 가능성은 현재의 기후モデル이나 기후 예보에 따라 달러요ন기법을 통해 예측되고 있습니다. 라니냐는 태평양 해표면 온도that cools the sea surfaces in the Pacific, which can lead to global cooling, and it’s a periodic climate phenomenon.

지구 기후는 자연적 변동을 통해 La Niña와 El Niño가 交替하게 나타납니다. 2024년에도 La Niña의 가능성은 모델에 따라 예상됩니다. 그러나 기후 예보는 중도보다는 불확실한 성질을 가지고 있습니다.

결론적으로, 2024년 겨울에 La Niña가 발생할 수 있는 가능성이 있습니다, but it’s not certain.

지구 기후는 매우复杂한 시스템이고 예상치도 중도보다는 불확실합니다. 2024년 La Niña가 실제로 발생할지 모르겠습니다.

처리:

slot update_slots: id  0 | task 9109 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 3802
slot update_slots: id  0 | task 9109 | kv cache rm [1, end)
slot update_slots: id  0 | task 9109 | prompt processing progress, n_past = 2049, n_tokens = 2048, progress = 0.538664
slot update_slots: id  0 | task 9109 | kv cache rm [2049, end)
slot update_slots: id  0 | task 9109 | prompt processing progress, n_past = 3802, n_tokens = 1753, progress = 0.999737
slot update_slots: id  0 | task 9109 | prompt done, n_past = 3802, n_tokens = 1753
slot update_slots: id  0 | task 9109 | slot context shift, n_keep = 1, n_left = 4094, n_discard = 2047
slot      release: id  0 | task 9109 | stop processing: n_past = 2173, truncated = 1
slot print_timing: id  0 | task 9109 |
prompt eval time =   10869.47 ms /  3801 tokens (    2.86 ms per token,   349.70 tokens per second)
       eval time =  166385.48 ms /   419 tokens (  397.10 ms per token,     2.52 tokens per second)
      total time =  177254.94 ms /  4220 tokens

경제 이론

질문:

1	현대 화폐 이론에 대해서 설명해줘

답:

Modern currency theory encompasses a range of concepts and principles that explain the functioning and role of money in modern economies. Here’s a structured and organized summary of the key points:

Evolution of Money:
- Abstract Nature: Money has evolved beyond physical coins and paper to include abstract forms like fiat currency, which is not backed by a physical commodity.
- Trust and Confidence: The foundation of modern money is the trust and confidence that a currency will be accepted in the future, ensuring its value remains stable over time.
Functions of Money:
- Medium of Exchange: facilitates the buying and selling of goods and services.
- Unit of Account: standardizes the measurement of value across economies.
- Store of Value: allows for saving and investment, maintaining purchasing power over time.
Central Banks and Monetary Policy:
- Role in Regulation: Central banks influence money supply and interest rates, using tools like interest rate adjustments to manage inflation and economic growth.
- Monetary Policy Tools: Open market operations, where central banks buy or sell government securities, affect the money supply and interest rates.
Fractional Reserve Banking:
- Reserve Requirements: Banks keep a fraction of their deposits as reserves, lending the rest. This practice can expand the money supply through the multiplier effect.
Modern Monetary Theory (MMT):
- Key Idea: Countries controlling their currency can spend freely, potentially without worrying about running out of money, as long as inflation is controlled.
- Practical Implications: MMT suggests that governments can finance public spending through currency creation, but it emphasizes the need to maintain price stability.
Globalization and Currency Management:
- Exchange Rates: The interconnected global economy requires countries to manage their currencies in a way that aligns with global markets.
- Impact of Monetary Policy: Central banks must consider how their policies affect global exchange rates and trade balances.
Technological Influences:
- Digital Money: Innovations like cryptocurrencies and central bank digital currencies (CBDCs) challenge traditional views of money and its management.
- Technological Disruptions: These innovations can affect financial stability and the traditional role of central banks.
Inflation and Deflation Management:
- Central Bank Tools: Central banks use interest rates and other tools to control inflation and deflation, aiming to maintain economic stability.
- Economic Scenarios: Different economic conditions may require varied approaches to monetary policy.
Interconnected Concepts:
- Key Principles: Trust, confidence, and the dual role of central banks in providing liquidity and controlling inflation are central to modern currency theories.
- Interconnections: Understanding how these elements relate is crucial for grasping the overall framework of modern currency theories.

In summary, modern currency theories provide a comprehensive framework for understanding the role and functioning of money in contemporary economies, incorporating elements of trust, technological innovation, and global interconnectedness.

처리:

slot update_slots: id  0 | task 9530 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 4037
slot update_slots: id  0 | task 9530 | kv cache rm [1, end)
slot update_slots: id  0 | task 9530 | prompt processing progress, n_past = 2049, n_tokens = 2048, progress = 0.507307
slot update_slots: id  0 | task 9530 | kv cache rm [2049, end)
slot update_slots: id  0 | task 9530 | prompt processing progress, n_past = 4037, n_tokens = 1988, progress = 0.999752
slot update_slots: id  0 | task 9530 | prompt done, n_past = 4037, n_tokens = 1988
slot update_slots: id  0 | task 9530 | slot context shift, n_keep = 1, n_left = 4094, n_discard = 2047
slot      release: id  0 | task 9530 | stop processing: n_past = 3370, truncated = 1
slot print_timing: id  0 | task 9530 |
prompt eval time =   10827.40 ms /  4036 tokens (    2.68 ms per token,   372.76 tokens per second)
       eval time =  556137.12 ms /  1381 tokens (  402.71 ms per token,     2.48 tokens per second)
      total time =  566964.51 ms /  5417 tokens

크롤링

질문:

1	have you got any crawling ability from some url?

답:

Final Answer:

In the context of modern currency theories, “crawling ability” is likely a metaphorical term that describes the dynamic and adaptive nature of money within the modern economy. It suggests that money is not static but is constantly in motion and undergoing transformations, such as moving between different forms (physical, digital), being exchanged across borders, and adapting to technological advancements. This ability reflects the interconnectedness and fluidity of modern financial systems, where money circulates efficiently and changes in response to economic shifts and technological innovations.

처리:

slot update_slots: id  0 | task 10913 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 4675
slot update_slots: id  0 | task 10913 | input truncated, n_ctx = 4096, n_keep = 0, n_left = 4096, n_prompt_tokens = 2627
slot update_slots: id  0 | task 10913 | kv cache rm [0, end)
slot update_slots: id  0 | task 10913 | prompt processing progress, n_past = 2048, n_tokens = 2048, progress = 0.779597
slot update_slots: id  0 | task 10913 | kv cache rm [2048, end)
slot update_slots: id  0 | task 10913 | prompt processing progress, n_past = 2627, n_tokens = 579, progress = 1.000000
slot update_slots: id  0 | task 10913 | prompt done, n_past = 2627, n_tokens = 579
slot      release: id  0 | task 10913 | stop processing: n_past = 3453, truncated = 1
slot print_timing: id  0 | task 10913 |
prompt eval time =    7698.41 ms /  2627 tokens (    2.93 ms per token,   341.24 tokens per second)
       eval time =  329577.53 ms /   827 tokens (  398.52 ms per token,     2.51 tokens per second)
      total time =  337275.94 ms /  3454 tokens

외부 파일 처리 여부

질문:

1	너는 외부 텍스트 파일을 읽고 질문에 답해 줄 수 있어?

답:

겨울철 강수량이 그 다음 해의 농수산물 수확량에 미치는 영향은, 복잡한 다섯 가지 요소에 의해 다양한 결과를 나타내줄 수 있습니다. 이 요소들은 다음과 같습니다:

땀의 상태:
- 이루는 강수: 토양을潤하고, 다음 해의 성장에 도움을 줄 수 있습니다.
- 너무한 강수: 수해로 인해 작물에 손상을 입거나, 성장을妨げ줄 수 있습니다.
강수의 타이밍:
- 이른 강수: 심은 전에 일어나는ため, 다음 해의 재배에 영향을 미칠 수 있습니다.
- 지연된 강수: 성장 단계기에 발생해, 작물에 무게를 주는 데 기여할 수 있습니다.
작물의 유형:
- 민감한 작물: 쌀 등은 강수에 특히 민감하며, 수확량을 크게 감소할 수 있습니다.
- 민감도不同的 작물: 보리, 맥아 등은 강수에 상대적으로 강해, 수확량의 영향을 덜 받을 수 있습니다.
지역의 기후:
- 북부 지역: 강설이 많이 내려, 작물 성장에 어려움을 주는 데 기여할 수 있습니다.
- 남부 지역: 강수량이 적을 수 있습니다.
농업 기법:
- 조도 기법: 강수를 관리하는 데 도움을 줄 수 있습니다.
- 灌漑 기법: 토양에 적절한 수분을 유지하는 데 도움을 줄 수 있습니다.
정부 정책:
- 농업 지원 정책: 농업을 지지하는 정책을 통해 강수에 대한 영향을 완화하는 데 도움을 줄 수 있습니다.
** 长期 기후 변화**:
- 기후 변화로 인해 강수 양과 패턴이 바뀌고 있습니다. 이는, 농업에 대한 영향도 변해나갈 수 있습니다.
역사적 데이터와 통계 자료:
- 역사적 데이터나 연구를 통해, 강수량과 수확량의 관계를 분석할 수 있습니다.
경제적 영향:
- 작물 손실로 인해 식량 가격과 공급망에 영향을 미칠 수 있습니다. Farmers might need insurance to cover their losses, and governments might offer aid to support affected areas.

결론:
겨울철 강수량이 다음 해의 농수산물 수확량에 미치는 영향은, 복잡한 요소들의 상互작을 통해 다양한 결과를 나타내줄 수 있습니다. 이 요소들을 이해하고, 각自変연락된 영향을 고려하여, 농업을 계획할 때 중요한 정보를 활용할 수 있습니다.

메모리 부족인가, 엉뚱한 답을 내놓았다.

처리:

slot update_slots: id  0 | task 11742 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 4803
slot update_slots: id  0 | task 11742 | input truncated, n_ctx = 4096, n_keep = 0, n_left = 4096, n_prompt_tokens = 2755
slot update_slots: id  0 | task 11742 | kv cache rm [2627, end)
slot update_slots: id  0 | task 11742 | prompt processing progress, n_past = 2755, n_tokens = 128, progress = 0.046461
slot update_slots: id  0 | task 11742 | prompt done, n_past = 2755, n_tokens = 128
slot update_slots: id  0 | task 11742 | slot context shift, n_keep = 1, n_left = 4094, n_discard = 2047
slot      release: id  0 | task 11742 | stop processing: n_past = 2088, truncated = 1
slot print_timing: id  0 | task 11742 |
prompt eval time =    1320.06 ms /   128 tokens (   10.31 ms per token,    96.97 tokens per second)
       eval time =  552944.30 ms /  1381 tokens (  400.39 ms per token,     2.50 tokens per second)
      total time =  554264.35 ms /  1509 tokens

질문:

1	너는 pdf 파일을 읽고 질문에 답해 줄 수 있어?

답:

네, 너와 같이 PDF 파일을 읽고 질문에 답변할 수 있는 기능을 가지고 있습니다.ただし, PDF 파일의 텍스트를 읽을 때는, 때로는 이미지를 사용한 텍스트나 보호된 콘텐츠로 인해,directly PDF를 읽을 수 없습니다. 그러나, PDF내의 텍스트를 이미지로 저장해 오른다면, 그 이미지를 분석하고 텍스트를 추출해 질문에 답변할 수 있습니다.

또한, PDF 파일을 직접 읽는 대신, PDF내의 텍스트를 복사하고貼어오면, 그 텍스트를 가지고 답변을 제공할 수 있습니다.

즉, PDF 파일을 통해 정보를 취득하고 답변할 수 있습니다, 단, PDF의 구조나 보호된 콘텐츠가 아닌普通な 텍스트일 때는 가능합니다.

처리:

slot update_slots: id  0 | task 13124 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 5456
slot update_slots: id  0 | task 13124 | input truncated, n_ctx = 4096, n_keep = 0, n_left = 4096, n_prompt_tokens = 3408
slot update_slots: id  0 | task 13124 | kv cache rm [1, end)
slot update_slots: id  0 | task 13124 | prompt processing progress, n_past = 2049, n_tokens = 2048, progress = 0.600939
slot update_slots: id  0 | task 13124 | kv cache rm [2049, end)
slot update_slots: id  0 | task 13124 | prompt processing progress, n_past = 3408, n_tokens = 1359, progress = 0.999707
slot update_slots: id  0 | task 13124 | prompt done, n_past = 3408, n_tokens = 1359
slot      release: id  0 | task 13124 | stop processing: n_past = 3688, truncated = 1
slot print_timing: id  0 | task 13124 |
prompt eval time =    9517.07 ms /  3407 tokens (    2.79 ms per token,   357.99 tokens per second)
       eval time =  112992.25 ms /   281 tokens (  402.11 ms per token,     2.49 tokens per second)
      total time =  122509.32 ms /  3688 tokens

마무리

한글에 대한 이해가 부족하다
한글 질문에 영문 답변이 꽤 있을 듯 하다.
각 질문에 대한 응답이 느리다.

2025-01-31 게시 됨2025-02-12 업데이트 됨AI / LLM한 시간안에 읽기 (약 7870 단어)

Local LLM 실험: Qwen2.5-32B-Instruct, RTX 3080 TI

RTX 3080TI 를 사용해서 LLM 모델을 Local 로 돌려보고 있다.

wikidoc 의 https://wikidocs.net/226033 질문지와 2~3개 질문을 추가해서 진행했다.

시스템 사양

AMD Ryzen 7 5800X3D
RAM 64GB
RTX 3080 TI

Qwen2.5-32B

https://huggingface.co/bartowski/Qwen2.5-32B-Instruct-GGUF

Qwen2.5-32B-Instruct-Q8_0.gguf

누구?

질문:

누구냐 너

오늘이 며칠이지?

언제까지의 데이터를 학습했지?

저는Claude라는 AI 어시스턴트입니다. 오늘 날짜와 제 학습 데이터의 최신 일자는 조금 전에 업데이트된 정보가 없어서 정확히 말씀드리기 어렵습니다. 최신 정보를 확인하려면 인터넷 검색을 이용해 보시는 것이 좋을 것 같습니다. 다른 질문이 있으시다면 도와드릴 수 있어요.

slot launch_slot_: id  1 | task 1608 | processing task
slot update_slots: id  1 | task 1608 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 45
slot update_slots: id  1 | task 1608 | kv cache rm [0, end)
slot update_slots: id  1 | task 1608 | prompt processing progress, n_past = 45, n_tokens = 45, progress = 1.000000
slot update_slots: id  1 | task 1608 | prompt done, n_past = 45, n_tokens = 45
slot      release: id  1 | task 1608 | stop processing: n_past = 132, truncated = 0
slot print_timing: id  1 | task 1608 | 
prompt eval time =    2264.88 ms /    45 tokens (   50.33 ms per token,    19.87 tokens per second)
       eval time =   46491.17 ms /    88 tokens (  528.31 ms per token,     1.89 tokens per second)
      total time =   48756.05 ms /   133 tokens

질문:

1	니가 이해할 수 있는 언어는 어떠 언어들이야?

답:

저는 다양한 언어를 이해하고 응답할 수 있습니다. 주요 언어로는 영어, 한국어, 스페인어, 프랑스어, 독일어, 이탈리아어, 네덜란드어, 러시아어, 중국어(간체와 번체), 일본어 등이 있습니다. 그러나 완벽하게 모든 표현과 사lang를 이해하는 것은 어려울 수 있습니다. 어떤 언어든 간에, 최선을 다해 이해하고 요구에 부응하도록 노력하겠습니다. 어떤 언어로 대화를 이어가시겠습니까?

처리:

slot launch_slot_: id  1 | task 4301 | processing task
slot update_slots: id  1 | task 4301 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 4205
slot update_slots: id  1 | task 4301 | input truncated, n_ctx = 2048, n_keep = 0, n_left = 2048, n_prompt_tokens = 1133
slot update_slots: id  1 | task 4301 | kv cache rm [0, end)
slot update_slots: id  1 | task 4301 | prompt processing progress, n_past = 1133, n_tokens = 1133, progress = 1.000000
slot update_slots: id  1 | task 4301 | prompt done, n_past = 1133, n_tokens = 1133
slot      release: id  1 | task 4301 | stop processing: n_past = 1269, truncated = 1
slot print_timing: id  1 | task 4301 | 
prompt eval time =    6605.68 ms /  1133 tokens (    5.83 ms per token,   171.52 tokens per second)
       eval time =   77321.26 ms /   137 tokens (  564.39 ms per token,     1.77 tokens per second)
      total time =   83926.94 ms /  1270 tokens

데이터

질문: “언제까지의 데이터를 학습했지?”

제 정확한 학습 데이터의 최신 일자는 제가实时更新的日期信息有限，无法精确提供。我的训练数据截止日期是2021年10月。因此，对于此日期之后的事件或发展，我可能无法提供相关信息。如果您有关于此日期之前的问题，我很乐意帮助您。

slot launch_slot_: id  1 | task 1697 | processing task
slot update_slots: id  1 | task 1697 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 154
slot update_slots: id  1 | task 1697 | kv cache rm [132, end)
slot update_slots: id  1 | task 1697 | prompt processing progress, n_past = 154, n_tokens = 22, progress = 0.142857
slot update_slots: id  1 | task 1697 | prompt done, n_past = 154, n_tokens = 22
slot      release: id  1 | task 1697 | stop processing: n_past = 223, truncated = 0
slot print_timing: id  1 | task 1697 | 
prompt eval time =    3526.18 ms /    22 tokens (  160.28 ms per token,     6.24 tokens per second)
       eval time =   37191.69 ms /    70 tokens (  531.31 ms per token,     1.88 tokens per second)
      total time =   40717.87 ms /    92

창조능력

질문: “‘고구마’로 삼행시를 지어줘”

물론이죠! '고구마'를 주제로 삼행시를 지어보겠습니다.

푸른 논밭 사이에
고구마 줄기 휘감고
달콤한 가을을

이런 식으로 지을 수 있습니다. 어떻게 생각하시나요?


slot launch_slot_: id  1 | task 1837 | processing task
slot update_slots: id  1 | task 1837 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 338
slot update_slots: id  1 | task 1837 | kv cache rm [314, end)
slot update_slots: id  1 | task 1837 | prompt processing progress, n_past = 338, n_tokens = 24, progress = 0.071006
slot update_slots: id  1 | task 1837 | prompt done, n_past = 338, n_tokens = 24
slot      release: id  1 | task 1837 | stop processing: n_past = 393, truncated = 0
slot print_timing: id  1 | task 1837 | 
prompt eval time =    3794.05 ms /    24 tokens (  158.09 ms per token,     6.33 tokens per second)
       eval time =   30098.94 ms /    56 tokens (  537.48 ms per token,     1.86 tokens per second)
      total time =   33892.99 ms /    80 tokens

끝말잇기

질문: 끝말잇기를 하자. 내가 먼저 할게.

기차

좋아요! 끝말잇기 시작할게요. 당신이 말한 단어가 "기차"이므로, '아'로 시작하는 단어로 이어갑니다.

아이스クリーム

이제 당신 차례입니다!

“차례”

차례라는 단어로 이어가기 위해 '스'로 시작하는 단어로 할게요.

스KY

이제您的回合了！请给出一个以"Y"开头的词。

slot launch_slot_: id  1 | task 1894 | processing task
slot update_slots: id  1 | task 1894 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 405
slot update_slots: id  1 | task 1894 | kv cache rm [393, end)
slot update_slots: id  1 | task 1894 | prompt processing progress, n_past = 405, n_tokens = 12, progress = 0.029630
slot update_slots: id  1 | task 1894 | prompt done, n_past = 405, n_tokens = 12
slot      release: id  1 | task 1894 | stop processing: n_past = 449, truncated = 0
slot print_timing: id  1 | task 1894 | 
prompt eval time =    1970.01 ms /    12 tokens (  164.17 ms per token,     6.09 tokens per second)
       eval time =   24246.19 ms /    45 tokens (  538.80 ms per token,     1.86 tokens per second)
      total time =   26216.20 ms /    57 tokens

문제 만들기1

질문: “초등 국어 문제 3개 만들어줘, 힌트 정답 해설 포함”

물론입니다! 초등학교 국어 문제 3개와 각 문제에 대한 힌트, 정답, 그리고 해설을 만들어 드리겠습니다.

### 문제 1
문제: 다음 글자들의 순서를 바꿔 새로운 단어를 만들어 보세요.
- 글자: "아침"
- 힌트: "아침"을 다른 단어로 바꾸세요.
- 정답: "카미"
- 해설: "아침"의 글자들을 바꾸어 새로운 단어를 만들 수 있습니다. 여기서 "카미"는 "신"을 의미하는 한자어로, "아침"의 글자들을 다른 순서로 배치하여 만들 수 있습니다.

### 문제 2
문제: 다음 문장에서 밑줄 친 부분을 다른 단어로 바꾸어 보세요.
- 문장: "나는 바다에서 물고기를 잡았다."
- 밑줄 친 부분: "잡았다"
- 힌트: "잡았다"를 다른 단어로 바꾸어 보세요.
- 정답: "捞到了" (捞到了 - 물고기를 잡았다의 의미)
- 해설: 문장에서 "잡았다"는 물고기를 잡은 것을 의미하는 동사입니다. 이 동사를 다른 동사로 바꾸어도 같은 의미를 나타낼 수 있습니다. 예를 들어 "捞到了"는 중국어로 물고기를 잡았다는 의미를 나타냅니다.

### 문제 3
문제: 다음 문장에서 밑줄 친 부분의 맞춤법을 고쳐보세요.
- 문장: "우리 학교는 올해 새로운 교장 선생님이 오셨습니다."
- 밑줄 친 부분: "교장 선생님"
- 힌트: "교장 선생님"의 맞춤법을 고쳐보세요.
- 정답: "교장선생님"
- 해설: "교장선생님"은 한 단어로 쓰는 것이 맞습니다. "교장"과 "선생님" 사이에 띄어쓰기는 필요하지 않습니다. 따라서, "교장 선생님"의 맞춤법은 "교장선생님"으로 고쳐야 합니다.

이렇게 세 가지 문제와 그에 따른 힌트, 정답, 해설을 제시해 드렸습니다. 문제를 풀면서 국어의 다양한 측면을 이해하는데 도움이 되기를 바랍니다!

slot launch_slot_: id  0 | task 456 | processing task
slot update_slots: id  0 | task 456 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 561
slot update_slots: id  0 | task 456 | kv cache rm [531, end)
slot update_slots: id  0 | task 456 | prompt processing progress, n_past = 561, n_tokens = 30, progress = 0.053476
slot update_slots: id  0 | task 456 | prompt done, n_past = 561, n_tokens = 30
slot      release: id  0 | task 456 | stop processing: n_past = 1113, truncated = 0
slot print_timing: id  0 | task 456 | 
prompt eval time =    4032.37 ms /    30 tokens (  134.41 ms per token,     7.44 tokens per second)
       eval time =  275758.92 ms /   553 tokens (  498.66 ms per token,     2.01 tokens per second)
      total time =  279791.29 ms /   583 tokens

문제만들기2

질문:

1	고등학교 지구과학 문제 3개를 만들어져, 힌트, 정답과 해설을 포함해줘

답:

물론입니다! 고등학교 지구과학 문제 3개와 각 문제에 대한 힌트, 정답, 그리고 해설을 만들어 드리겠습니다.

### 문제 1
문제: 지구의 외부 구조 중에서 지표면에서 가장 상부에 위치하는 계층을 무엇이라고 부르나요?
- 힌트: 지구의 외부 구조 중에서 가장 상부에 있는 계층에 대한 단어를 기억해 보세요.
- 정답: 대기권
- 해설: 지구의 외부 구조 중에서 지표면에서 가장 상부에 위치하는 계층은 "대기권"입니다. 대기권은 지구를 둘러싸고 있는 기체의 층으로, 대기압, 기온, 습도 등의 변화를 보입니다.

### 문제 2
문제: 지구의 외부 구조 중에서 지표면에서 두 번째로 상부에 위치하는 계층을 무엇이라고 부르나요?
- 힌트: 지구의 외부 구조 중에서 대기권 다음에 위치하는 계층에 대한 단어를 기억해 보세요.
- 정답: 수권
- 해설: 지구의 외부 구조 중에서 대기권 다음에 위치하는 계층은 "수권"입니다. 수권은 지구 표면에 존재하는 물, 즉 바다, 호수, 강 등의 총합을 의미합니다. 이 계층은 지구 표면의 약 71%를 차지하고 있습니다.

### 문제 3
문제: 지구의 내부 구조 중에서 가장 내부에 위치하는 구조체를 무엇이라고 부르나요?
- 힌트: 지구 내부 구조 중에서 가장 중심에 위치하는 구조체에 대한 단어를 기억해 보세요.
- 정답: 지구핵
- 해설: 지구의 내부 구조 중에서 가장 내부에 위치하는 구조체는 "지구핵"입니다. 지구핵은 지구의 중심부에 위치하고 있으며, 내핵과 외핵으로 구분됩니다. 내핵은 고체 상태로, 주로 철과 니켈로 이루어져 있으며, 외핵은 액체 상태로, 주로 철과 니켈로 구성되어 있습니다. 지구핵은 지구의 자기장 형성에 중요한 역할을 합니다.

이렇게 세 가지 문제와 그에 따른 힌트, 정답, 해설을 제시해 드렸습니다. 문제를 풀면서 지구과학의 다양한 측면을 이해하는데 도움이 되기를 바랍니다!

slot launch_slot_: id  0 | task 1010 | processing task
slot update_slots: id  0 | task 1010 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 1151
slot update_slots: id  0 | task 1010 | kv cache rm [1113, end)
slot update_slots: id  0 | task 1010 | prompt processing progress, n_past = 1151, n_tokens = 38, progress = 0.033015
slot update_slots: id  0 | task 1010 | prompt done, n_past = 1151, n_tokens = 38
slot      release: id  0 | task 1010 | stop processing: n_past = 1747, truncated = 0
slot print_timing: id  0 | task 1010 | 
prompt eval time =    2527.36 ms /    38 tokens (   66.51 ms per token,    15.04 tokens per second)
       eval time =  302107.79 ms /   597 tokens (  506.04 ms per token,     1.98 tokens per second)
      total time =  304635.15 ms /   635 tokens
srv  update_slots: all slots are idle

판단

질문: “철수는 하루에 치킨 100마리를 튀기고 민수는 하루에 치킨 60마리를 튀긴다. 누가 더 일을 잘하지?”

철수와 민수 중 누가 더 일을 잘하는지 판단하는 것은 단순히 하루에 튀기는 치킨의 수로만 결정될 수는 없습니다. 몇 가지 다른 요소를 고려해야 합니다:

1. **효율성**: 치킨을 튀기는 속도와 효율성은 중요합니다. 철수가 더 많은 치킨을 튀기지만, 그 과정이 효율적인지 혹은 민수의 작업이 더 효율적인지 고려해야 합니다.
   
2. **품질**: 튀기는 치킨의 품질도 중요한 요소입니다. 철수가 많은 치킨을 튀기지만, 민수의 치킨이 더 맛있고 품질이 높다면, 민수의 작업이 더 가치가 있을 수 있습니다.

3. **체력과 지속 가능성**: 하루에 많은 치킨을 튀기는 것은 체력과 지속 가능성도 고려해야 합니다. 철수가 하루에 100마리의 치킨을 튀길 수 있지만, 지속적으로 그렇게 유지할 수 있을지, 그리고 체력에 영향을 미치지 않는지 확인해야 합니다.

4. **업무 분담**: 만약 철수가 다른 업무도 함께 수행하고 있다면, 그 점도 고려해야 합니다. 민수가 주로 치킨을 튀기는 일을 맡고 있으면서도 다른 업무를 잘 수행하고 있다면, 그 점도 중요합니다.

따라서, 단순히 치킨을 튀기는 수뿐만 아니라 다른 여러 요소를 종합적으로 고려해야 합니다.

slot launch_slot_: id  1 | task 1940 | processing task
slot update_slots: id  1 | task 1940 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 505
slot update_slots: id  1 | task 1940 | kv cache rm [449, end)
slot update_slots: id  1 | task 1940 | prompt processing progress, n_past = 505, n_tokens = 56, progress = 0.110891
slot update_slots: id  1 | task 1940 | prompt done, n_past = 505, n_tokens = 56
slot      release: id  1 | task 1940 | stop processing: n_past = 879, truncated = 0
slot print_timing: id  1 | task 1940 | 
prompt eval time =    2152.89 ms /    56 tokens (   38.44 ms per token,    26.01 tokens per second)
       eval time =  208564.31 ms /   375 tokens (  556.17 ms per token,     1.80 tokens per second)
      total time =  210717.20 ms /   431 tokens

문자 교정

질문:

1
2
3

다음 텍스트를 자연스럽게 교정해 줘.

이번 장에서 여러분은 커널을 디버깅을 하는 데 있어 여러 가지 접근 방법이 있다는 것을 배웠다. 우리는 어떤 상황에서 어떤 접근 방법을 사용해야 할지 빠르게 결정할 수 있도록 그런 접근 방법들을 분류도 해봤다. 모든 도구 혹은 기법이 모든 시나리오 혹은 상황에 도움이 되지 않는다는 것이 핵심 포인트 중 하나다. 예를 들어서 KASAN 같은 강력한 메모리 체커는 개발 단계 및 유닛 테스트 단계에서는 정말 유용하지만 시스템 테스트나 제품화 단계에서는 일반적으로 사용이 불가능 하다 (다(프로덕션 커널은 디버그 커널과 달리 KASAN 사용이 비활성화 되도록 환경 설정이 되기 때문이다.)

답:

물론입니다! 다음은 교정된 텍스트입니다:

---
이 장에서는 커널을 디버깅할 때 여러 가지 접근 방법이 있다는 것을 배웠습니다. 우리는 어떤 상황에서 어떤 접근 방법을 사용해야 하는지 빠르게 결정할 수 있도록 그런 접근 방법들을 분류했습니다. 모든 도구나 기법이 모든 시나리오나 상황에서 도움이 되는 것은 아니라는 것이 핵심 포인트 중 하나입니다. 예를 들어, KASAN과 같은 강력한 메모리 체커는 개발 단계와 유닛 테스트 단계에서는 매우 유용하지만, 시스템 테스트나 제품화 단계에서는 일반적으로 사용할 수 없습니다. 프로덕션 커널은 디버그 커널과 달리 KASAN 사용이 비활성화되어 있기 때문입니다.

---

이렇게 수정하면 좀 더 자연스럽고 명확해집니다. 어떻게 생각하시나요?


좋은데

감사합니다! 텍스트가 자연스럽고 명확하게 수정되었다면 다행입니다. 다른 문장이나 텍스트를 수정하거나 도와드릴 다른 것이 있으면 말씀해 주세요!

아니면, 추가로 질문이나 요청사항이 있으면 언제든지 말씀해 주세요!

처리:

slot launch_slot_: id  1 | task 2316 | processing task
slot update_slots: id  1 | task 2316 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 1101
slot update_slots: id  1 | task 2316 | kv cache rm [879, end)
slot update_slots: id  1 | task 2316 | prompt processing progress, n_past = 1101, n_tokens = 222, progress = 0.201635
slot update_slots: id  1 | task 2316 | prompt done, n_past = 1101, n_tokens = 222
slot      release: id  1 | task 2316 | stop processing: n_past = 1319, truncated = 0
slot print_timing: id  1 | task 2316 | 
prompt eval time =    2684.30 ms /   222 tokens (   12.09 ms per token,    82.70 tokens per second)
       eval time =  122044.77 ms /   219 tokens (  557.28 ms per token,     1.79 tokens per second)
      total time =  124729.07 ms /   441 tokens
srv  update_slots: all slots are idle
request: POST /v1/chat/completions 127.0.0.1 200
slot launch_slot_: id  1 | task 2536 | processing task
slot update_slots: id  1 | task 2536 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 1332
slot update_slots: id  1 | task 2536 | kv cache rm [1319, end)
slot update_slots: id  1 | task 2536 | prompt processing progress, n_past = 1332, n_tokens = 13, progress = 0.009760
slot update_slots: id  1 | task 2536 | prompt done, n_past = 1332, n_tokens = 13
slot      release: id  1 | task 2536 | stop processing: n_past = 1398, truncated = 0
slot print_timing: id  1 | task 2536 | 
prompt eval time =    2254.52 ms /    13 tokens (  173.42 ms per token,     5.77 tokens per second)
       eval time =   38159.37 ms /    67 tokens (  569.54 ms per token,     1.76 tokens per second)
      total time =   40413.88 ms /    80 tokens

영문 번역

질문:

1
2
3

We both worked with young moms who go completely dark for a few hours in the evening, when they are with their families and putting their kids to bed.

위 문장을 한국어로 번역해

물론입니다! 다음은 번역된 문장입니다:

---

우리는 둘 다 저녁에 가족과 함께 아이들을 눕히는 시간 동안 완전히 조용해지는 젊은媽媽的情境工作過。

如果您希望保持一致性，這裡是完整的韓文翻譯：

---

우리는 둘 다 저녁에 가족과 함께 아이들을 눕히는 시간 동안 완전히 조용해지는 젊은 엄마들과 일한 경험이 있습니다.

---

이렇게 번역하면 자연스럽고 이해하기 쉬울 것입니다. 어떻게 생각하시나요?

slot launch_slot_: id  1 | task 2604 | processing task
slot update_slots: id  1 | task 2604 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 1448
slot update_slots: id  1 | task 2604 | kv cache rm [1398, end)
slot update_slots: id  1 | task 2604 | prompt processing progress, n_past = 1448, n_tokens = 50, progress = 0.034530
slot update_slots: id  1 | task 2604 | prompt done, n_past = 1448, n_tokens = 50
slot      release: id  1 | task 2604 | stop processing: n_past = 1584, truncated = 0
slot print_timing: id  1 | task 2604 | 
prompt eval time =    1916.69 ms /    50 tokens (   38.33 ms per token,    26.09 tokens per second)
       eval time =   77475.99 ms /   137 tokens (  565.52 ms per token,     1.77 tokens per second)
      total time =   79392.68 ms /   187 tokens

17. 명령 에러 처리

질문:

1	crontab -e 명령 실행 시에만 E319: Sorry, the command is not available in this version 메시지가 나온다.

답:

처리:

slot launch_slot_: id  1 | task 2742 | processing task
slot update_slots: id  1 | task 2742 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 1628
slot update_slots: id  1 | task 2742 | kv cache rm [1584, end)
slot update_slots: id  1 | task 2742 | prompt processing progress, n_past = 1628, n_tokens = 44, progress = 0.027027
slot update_slots: id  1 | task 2742 | prompt done, n_past = 1628, n_tokens = 44
slot update_slots: id  1 | task 2742 | slot context shift, n_keep = 0, n_left = 2047, n_discard = 1023
slot      release: id  1 | task 2742 | stop processing: n_past = 1067, truncated = 1
slot print_timing: id  1 | task 2742 | 
prompt eval time =    2035.37 ms /    44 tokens (   46.26 ms per token,    21.62 tokens per second)
       eval time =  268579.62 ms /   463 tokens (  580.09 ms per token,     1.72 tokens per second)
      total time =  270614.99 ms /   507 tokens

18. 지명과 특산물

다음 지문을 읽고 문제에 답하시오.

---

1950년 7월, 한국 전쟁 초기에 이승만 대통령은 맥아더 장군에게 유격대원들을 북한군의 후방에 침투시키는 방안을 제안했다. 이후, 육군본부는 육본직할 유격대와 육본 독립 유격대를 편성했다. 국군은 포항과 인접한 장사동 지역에 상륙작전을 수행할 부대로 독립 제1유격대대를 선정했다. 육군본부는 독립 제1유격대대에 동해안의 장사동 해안에 상륙작전을 감행하여 북한군 제2군단의 보급로를 차단하고 국군 제1군단의 작전을 유리하게 하기 위한 작전명령(육본 작명 제174호)을 하달했다. 9월 14일, 독립 제1유격대대는 부산에서 LST 문산호에 승선하여 영덕군의 장사동으로 출항했다.

1950년 9월 15일, 독립 제1유격대대는 장사동 해안에 상륙을 시도하였으나 태풍 케지아로 인한 높은 파도와 안개로 인해 어려움을 겪었다. LST 문산호는 북한군의 사격과 파도로 인해 좌초되었고, 상륙부대는 09:00시경에 전원이 상륙을 완료하였다. 그 후, 15:00시경에 200고지를 점령하였고, 다양한 무기와 장비를 노획하였다. 9월 16일과 17일에는 독립 제1유격대대가 여러 위치에서 북한군과의 전투를 벌였으며, 미 구축함과의 연락 두절로 인해 추가적인 어려움을 겪었다.

장사동에서 위급한 상황에 처한 독립 제1유격대대를 구출하기 위해 해군본부는 LT-1(인왕호)를 급파했으나, LST 문산호의 구출에 실패했다. 해군본부는 상륙부대의 철수를 지원하기 위해 LST 조치원호를 현지로 보냈다. 9월 18일, 이명흠 부대장은 유엔 해군과의 협력 하에 부족한 식량과 탄약 지원을 받았다. 9월 19일, 유엔군의 함포지원과 함께 LST 조치원호가 도착하여 철수 작전을 시작했다. 스피어 소령은 직접 해안에 상륙하여 구조작전을 지시하였다. 9월 20일, 725명이 부산항으로 복귀했으나, 32명이 장사동 해안에 남아 북한군의 포로가 되었거나 탈출하여 국군에 합류하였다.

장사리 전투가 인천 상륙작전의 양동작전으로 알려졌으나, 이 전투가 드라마틱한 요소로 인해 과장되었으며, 실제로는 인천 상륙작전과 큰 관련이 없다. 또한, 북한이나 중국의 군사적 상황을 고려할 때, 장사리에서의 전투가 낙동강 전선에 영향을 끼칠 가능성은 낮다.

---

문제
1. 지문에 나오는 지명을 모두 쓰시오.
2. 그중 대게로 유명한 곳은?

답:

1. 지문에 나오는 지명들은 다음과 같습니다:
   - 포항
   - 장사동
   - 부산
   - 영덕군
   - 장사동 해안
   - 낙동강 전선
   - 인천
   - 부산항

2. 그 중에서 가장 유명한 곳은 **포항**입니다. 포항은 경상북도의 주요 항구 도시로, 대한민국에서 가장 큰 철강 산업 중심지 중 하나입니다. 포항은 대한민국에서 가장 중요한 도시 중 하나입니다.

처리:

slot launch_slot_: id  1 | task 3206 | processing task
slot update_slots: id  1 | task 3206 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 2965
slot update_slots: id  1 | task 3206 | input truncated, n_ctx = 2048, n_keep = 0, n_left = 2048, n_prompt_tokens = 1941
slot update_slots: id  1 | task 3206 | kv cache rm [0, end)
slot update_slots: id  1 | task 3206 | prompt processing progress, n_past = 1941, n_tokens = 1941, progress = 1.000000
slot update_slots: id  1 | task 3206 | prompt done, n_past = 1941, n_tokens = 1941
slot update_slots: id  1 | task 3206 | slot context shift, n_keep = 0, n_left = 2047, n_discard = 1023
slot      release: id  1 | task 3206 | stop processing: n_past = 1048, truncated = 1
slot print_timing: id  1 | task 3206 | 
prompt eval time =    9745.39 ms /  1941 tokens (    5.02 ms per token,   199.17 tokens per second)
       eval time =   74899.96 ms /   131 tokens (  571.76 ms per token,     1.75 tokens per second)
      total time =   84645.35 ms /  2072 tokens

강수량과 그 영향

질문: “겨울철 강수량이 그 다음 해의 농수산물 수확량에 미치는 영향은?”

겨울철 강수량은 다음 해의 농수산물 수확량에 많은 영향을 미칠 수 있습니다.

농업: 겨울철 강수량이 충분하면 땅 속에 충분한 수분이 저장되며, 이는 봄이나 여름에 농작물에 유리하게 작용합니다. 하지만 강수량이 너무 많으면 지나치게 습한 환경이 발생하여 일부 작물의 성장에 문제가 될 수 있습니다.

수산업: 강수량이 많을 경우, 강과 호수의 수위가 상승하여 물고기의 서식 환경에 영향을 미칩니다. 하지만, 너무 많은 강수량은 침수나 홍수를 유발할 수 있어 물고기의 서식 환경을 악화시키거나 이동을 유발할 수 있습니다. 반면, 강수량이 적을 경우, 수위가 떨어져 물고기의 서식 환경이 변할 수 있습니다.

따라서, 적절한 강수량은 다음 해의 농수산물 수확량에 긍정적인 영향을 미칠 수 있지만, 너무 적거나 너무 많은 강수량은 부정적인 영향을 끼칠 수 있습니다.

process

slot launch_slot_: id  0 | task 0 | processing task
slot update_slots: id  0 | task 0 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 47
slot update_slots: id  0 | task 0 | kv cache rm [0, end)
slot update_slots: id  0 | task 0 | prompt processing progress, n_past = 47, n_tokens = 47, progress = 1.000000
slot update_slots: id  0 | task 0 | prompt done, n_past = 47, n_tokens = 47
slot      release: id  0 | task 0 | stop processing: n_past = 346, truncated = 0
slot print_timing: id  0 | task 0 | 
prompt eval time =   18536.02 ms /    47 tokens (  394.38 ms per token,     2.54 tokens per second)
       eval time =  149232.71 ms /   300 tokens (  497.44 ms per token,     2.01 tokens per second)
      total time =  167768.73 ms /   347 tokens
srv  update_slots: all slots are idle

질문: “2024년 겨울에 라니냐가 발생할 수 있을것 같아?”

1
2
3

죄송합니다, 하지만 저는 실시간 데이터나 미래 예측 기능이 없는 AI로서 특정 연도의 기후 현상, 예를 들어 2024년 겨울의 라니냐 발생을 예측하는 것은 불가능합니다. 

기후 예측은 매우 복잡하고, 여러 가지 요인에 의해 영향을 받습니다. 이러한 예측은 주로 기상학자들과 기후학자들이 고급 기후 모델을 사용하여 수행합니다. 그러니, 이러한 정보에 대해 가장 정확한 예측을 얻으려면 기상청이나 기후 연구 기관의 최신 보고서를 참조하시는 것이 가장 좋을 것 같습니다.

slot launch_slot_: id  0 | task 301 | processing task
slot update_slots: id  0 | task 301 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 378
slot update_slots: id  0 | task 301 | kv cache rm [346, end)
slot update_slots: id  0 | task 301 | prompt processing progress, n_past = 378, n_tokens = 32, progress = 0.084656
slot update_slots: id  0 | task 301 | prompt done, n_past = 378, n_tokens = 32
slot      release: id  0 | task 301 | stop processing: n_past = 531, truncated = 0
slot print_timing: id  0 | task 301 | 
prompt eval time =    2125.94 ms /    32 tokens (   66.44 ms per token,    15.05 tokens per second)
       eval time =   75523.27 ms /   154 tokens (  490.41 ms per token,     2.04 tokens per second)
      total time =   77649.21 ms /   186 tokens
srv  update_slots: all slots are idle

경제 이론

질문:

현대 화폐 이론에 대해서 설명해줘

답:

현대 화폐 이론은 일반적으로 경제에서 화폐의 역할과 가치, 그리고 이들이 경제에 미치는 영향을 설명하는 이론들입니다. 이론은 복잡하며 여러 가지 학파와 학자들이 제공한 다양한 관점이 포함됩니다. 여기서 몇 가지 주요 화폐 이론에 대해 간략히 설명하겠습니다:

1. 화폐수요 이론: 이론에 따르면 사람들은 화폐를 보유하는 경향이 있습니다. 이것은 사람들이 미래의 소비를 위해 돈을 저축하거나, 시장에서 거래를 위해 화폐를 필요로 하기 때문입니다. 화폐수요는 일반적으로 물가수준, 실질수입, 금리, 그리고 화폐의 편의성과 안정성에 의해 결정됩니다.

2. 화폐공급 이론: 이론은 중앙은행이 화폐량을 조절하여 경제를 안정시키거나 확장시키는 방법을 설명합니다. 이를 통해 중앙은행은 통화정책을 통해 경제를 제어할 수 있습니다.

3. 화폐 중립성 이론: 이 이론은 장기적으로 화폐 공급의 변화가 실질적인 경제 변수(예를 들어, 생산량, 실업률)에 영향을 미치지 않는다는 것을 주장합니다.

4. 화폐 가치 이론: 화폐는 그 자체로 가치가 없습니다. 화폐의 가치는 그것이 교환을 위해 사용되는 다른 상품이나 서비스와 교환될 수 있기 때문에 생깁니다. 화폐의 가치는 주로 공급과 수요에 의해 결정됩니다.

5. 화폐 이론의 현대적 해석: 현대적 해석에서는 디지털 화폐와 암호화폐 같은 새로운 형태의 화폐를 포함하며, 화폐의 가치와 역할에 대해 더 넓은 시각을 제공합니다.

이러한 이론들은 경제학자들이 경제를 이해하고 예측하며 정책을 제안하는 데 도움을 줍니다. 그러나 실제 경제에서 이러한 이론들이 항상 정확하게 적용되는 것은 아닙니다. 각 이론은 특정한 가정과 제한 사항을 가지고 있어, 실제 세계의 복잡한 상황에서는 예측력이 떨어질 수 있습니다.

처리:

slot launch_slot_: id  1 | task 2742 | processing task
slot update_slots: id  1 | task 2742 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 1628
slot update_slots: id  1 | task 2742 | kv cache rm [1584, end)
slot update_slots: id  1 | task 2742 | prompt processing progress, n_past = 1628, n_tokens = 44, progress = 0.027027
slot update_slots: id  1 | task 2742 | prompt done, n_past = 1628, n_tokens = 44
slot update_slots: id  1 | task 2742 | slot context shift, n_keep = 0, n_left = 2047, n_discard = 1023
slot      release: id  1 | task 2742 | stop processing: n_past = 1067, truncated = 1
slot print_timing: id  1 | task 2742 | 
prompt eval time =    2035.37 ms /    44 tokens (   46.26 ms per token,    21.62 tokens per second)
       eval time =  268579.62 ms /   463 tokens (  580.09 ms per token,     1.72 tokens per second)
      total time =  270614.99 ms /   507 tokens

URL

질문:

1	have you got any crawling ability from some url?

답:

I don't have direct web crawling capabilities or the ability to interact with URLs in real-time. I can't fetch, browse or pull information from the internet. I can provide guidance on how to write a web crawler or how to use certain tools or programming languages to accomplish that. If you need a web crawler, you might consider using Python with libraries like Beautiful Soup or Scrapy. Would you like some basic guidance on how to use these tools?

처리:

slot launch_slot_: id  1 | task 2742 | processing task
slot update_slots: id  1 | task 2742 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 1628
slot update_slots: id  1 | task 2742 | kv cache rm [1584, end)
slot update_slots: id  1 | task 2742 | prompt processing progress, n_past = 1628, n_tokens = 44, progress = 0.027027
slot update_slots: id  1 | task 2742 | prompt done, n_past = 1628, n_tokens = 44
slot update_slots: id  1 | task 2742 | slot context shift, n_keep = 0, n_left = 2047, n_discard = 1023
slot      release: id  1 | task 2742 | stop processing: n_past = 1067, truncated = 1
slot print_timing: id  1 | task 2742 | 
prompt eval time =    2035.37 ms /    44 tokens (   46.26 ms per token,    21.62 tokens per second)
       eval time =  268579.62 ms /   463 tokens (  580.09 ms per token,     1.72 tokens per second)
      total time =  270614.99 ms /   507 tokens

외부 파일

질문:

1	너는 외부 텍스트 파일을 읽고 질문에 답해 줄 수 있어?

답:

저는 실시간으로 외부 텍스트 파일을 읽는 기능은 제공하지 않습니다. 하지만, 텍스트 파일의 내용을 복사하여 여기에 붙여넣으시면 그 내용을 바탕으로 질문에 답변 드릴 수 있습니다. 어떤 파일의 내용을 기반으로 답변을 원하시나요? 파일 내용을 직접 입력하거나 붙여넣으실 수 있습니다.

처리:

slot launch_slot_: id  1 | task 2742 | processing task
slot update_slots: id  1 | task 2742 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 1628
slot update_slots: id  1 | task 2742 | kv cache rm [1584, end)
slot update_slots: id  1 | task 2742 | prompt processing progress, n_past = 1628, n_tokens = 44, progress = 0.027027
slot update_slots: id  1 | task 2742 | prompt done, n_past = 1628, n_tokens = 44
slot update_slots: id  1 | task 2742 | slot context shift, n_keep = 0, n_left = 2047, n_discard = 1023
slot      release: id  1 | task 2742 | stop processing: n_past = 1067, truncated = 1
slot print_timing: id  1 | task 2742 | 
prompt eval time =    2035.37 ms /    44 tokens (   46.26 ms per token,    21.62 tokens per second)
       eval time =  268579.62 ms /   463 tokens (  580.09 ms per token,     1.72 tokens per second)
      total time =  270614.99 ms /   507 tokens

질문:

1	너는 pdf 파일을 읽고 질문에 답해 줄 수 있어?

답:

1
2
3

현재, 저는 실시간으로 외부 PDF 파일을 읽고 그 내용을 기반으로 답변하는 기능은 제공하지 않습니다. 하지만, PDF 파일의 내용을 텍스트 파일로 변환하고, 그 내용을 복사하여 여기에 붙여넣으시면 그 내용을 기반으로 질문에 답변 드릴 수 있습니다.

PDF 파일의 내용을 텍스트로 변환하는 방법은 여러 가지가 있습니다. 일반적인 방법으로는 PDF 변환 소프트웨어나 온라인 도구를 활용하는 것이 있습니다. 변환된 텍스트를 여기에 붙여넣으시면 도와드리겠습니다.

철:

slot launch_slot_: id  1 | task 4061 | processing task
slot update_slots: id  1 | task 4061 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 3913
slot update_slots: id  1 | task 4061 | input truncated, n_ctx = 2048, n_keep = 0, n_left = 2048, n_prompt_tokens = 1865
slot update_slots: id  1 | task 4061 | kv cache rm [1838, end)
slot update_slots: id  1 | task 4061 | prompt processing progress, n_past = 1865, n_tokens = 27, progress = 0.014477
slot update_slots: id  1 | task 4061 | prompt done, n_past = 1865, n_tokens = 27
slot      release: id  1 | task 4061 | stop processing: n_past = 2009, truncated = 1
slot print_timing: id  1 | task 4061 | 
prompt eval time =    4621.98 ms /    27 tokens (  171.18 ms per token,     5.84 tokens per second)
       eval time =   82524.97 ms /   145 tokens (  569.14 ms per token,     1.76 tokens per second)
      total time =   87146.96 ms /   172 tokens

질문:

1	그럼 어떤 버전의 Claude 를 사용해야 외부 파일을 다룰 수 있어?

답: (에러 발생)

현재 저는 외부 파일, PDF 문서를 직접 읽고 처리하는 기능을 제공하지 않습니다. 즉, 저는 실시간으로 외부 파일을 읽거나 처리하는 기능을 제공하지 않습니다.

하지,");
旵>"+
"+
"+
"+

처리:

slot launch_slot_: id  1 | task 4207 | processing task
slot update_slots: id  1 | task 4207 | new prompt, n_ctx_slot = 2048, n_keep = 0, n_prompt_tokens = 4089
slot update_slots: id  1 | task 4207 | input truncated, n_ctx = 2048, n_keep = 0, n_left = 2048, n_prompt_tokens = 2041
slot update_slots: id  1 | task 4207 | kv cache rm [2009, end)
slot update_slots: id  1 | task 4207 | prompt processing progress, n_past = 2041, n_tokens = 32, progress = 0.015679
slot update_slots: id  1 | task 4207 | prompt done, n_past = 2041, n_tokens = 32
slot update_slots: id  1 | task 4207 | slot context shift, n_keep = 0, n_left = 2047, n_discard = 1023
srv  cancel_tasks: cancel task, id_task = 4207
request: POST /v1/chat/completions 127.0.0.1 200
slot      release: id  1 | task 4207 | stop processing: n_past = 1109, truncated = 1

마무리

꽤 빠르다.
한글에 대해 꽤 이해를 하고 있다.

2025-01-31 게시 됨2025-02-12 업데이트 됨AI / LLM한 시간안에 읽기 (약 7012 단어)

Local LLM 실험: llama-3-Korean-Bllossom-8B, RTX 3080 TI

RTX 3080TI 를 사용해서 LLM 모델을 Local 로 돌려보고 있다.

wikidoc 의 https://wikidocs.net/226033 질문지와 2~3개 질문을 추가해서 진행했다.

시스템 사양

AMD Ryzen 7 5800X3D
RAM 64GB
RTX 3080 TI

llama-3-Korean-Bllossom-8B

https://huggingface.co/MLP-KTLim/llama-3-Korean-Bllossom-8B

누구?

질문:

누구냐 너

안녕하세요! 저는 인공지능이므로 실제 인물이 아니에요. 제가 제공할 수 있는 정보와 도움을 주기 위해 만들어졌어요. 어떤 질문이나 도움이 필요하신가요?

질문:

1	니가 이해할 수 있는 언어는 어떠 언어들이야?

답:

저는 다양한 언어로 커뮤니케이션을 할 수 있어요. 주요 언어로는 영어, 한국어, 일본어, 중국어, 스페인어, 프랑스어 등이 있어요. 다른 언어로 질문이 있으시면, 해당 언어로 대화할 수 있도록 최선을 다해 드리겠습니다.

처리:

slot launch_slot_: id  0 | task 221 | processing task
slot update_slots: id  0 | task 221 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 334
slot update_slots: id  0 | task 221 | kv cache rm [310, end)
slot update_slots: id  0 | task 221 | prompt processing progress, n_past = 334, n_tokens = 24, progress = 0.071856
slot update_slots: id  0 | task 221 | prompt done, n_past = 334, n_tokens = 24
slot      release: id  0 | task 221 | stop processing: n_past = 404, truncated = 0
slot print_timing: id  0 | task 221 |
prompt eval time =     734.61 ms /    24 tokens (   30.61 ms per token,    32.67 tokens per second)
       eval time =    8394.14 ms /    71 tokens (  118.23 ms per token,     8.46 tokens per second)
      total time =    9128.75 ms /    95 tokens

데이터

질문:

“언제까지의 데이터를 학습했지?”

답:

저는 2021년 5월까지의 데이터를 학습했어요. 이 데이터는 인공지능의 학습에 사용되는 정보로, 그 이후에 일어난 사건이나 정보는 학습되지 않았습니다. 다른 정보나 도움이 필요하신가요?

처리:

slot launch_slot_: id  0 | task 221 | processing task
slot update_slots: id  0 | task 221 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 334
slot update_slots: id  0 | task 221 | kv cache rm [310, end)
slot update_slots: id  0 | task 221 | prompt processing progress, n_past = 334, n_tokens = 24, progress = 0.071856
slot update_slots: id  0 | task 221 | prompt done, n_past = 334, n_tokens = 24
slot      release: id  0 | task 221 | stop processing: n_past = 404, truncated = 0
slot print_timing: id  0 | task 221 |
prompt eval time =     734.61 ms /    24 tokens (   30.61 ms per token,    32.67 tokens per second)
       eval time =    8394.14 ms /    71 tokens (  118.23 ms per token,     8.46 tokens per second)
      total time =    9128.75 ms /    95 tokens

창조능력

질문:

“‘고구마’로 삼행시를 지어줘”

고구마의 맛이 나
고구마의 맛이 나
고구마의 맛이 나

(삼행시의 기본 형식은 한 가지만, 여러 번 반복하는 것입니다. 이 경우는 '고구마'라는 주제에 대해 한 가지만 표현해 보았습니다.)

slot launch_slot_: id  0 | task 293 | processing task
slot update_slots: id  0 | task 293 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 428
slot update_slots: id  0 | task 293 | kv cache rm [404, end)
slot update_slots: id  0 | task 293 | prompt processing progress, n_past = 428, n_tokens = 24, progress = 0.056075
slot update_slots: id  0 | task 293 | prompt done, n_past = 428, n_tokens = 24
slot      release: id  0 | task 293 | stop processing: n_past = 494, truncated = 0
slot print_timing: id  0 | task 293 |
prompt eval time =     792.08 ms /    24 tokens (   33.00 ms per token,    30.30 tokens per second)
       eval time =    7918.76 ms /    67 tokens (  118.19 ms per token,     8.46 tokens per second)
      total time =    8710.84 ms /    91 tokens
srv  update_slots: all slots are idle

끝말잇기

질문:

1
2
3

끝말잇기를 하자. 내가 먼저 할게.

기차

답:

기차를 타고...

너?

> 대구를 가서

대구에서 물이나?

> 마셔볼까?

마셔보자!

처리:

slot launch_slot_: id  0 | task 418 | processing task
slot update_slots: id  0 | task 418 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 629
slot update_slots: id  0 | task 418 | kv cache rm [614, end)
slot update_slots: id  0 | task 418 | prompt processing progress, n_past = 629, n_tokens = 15, progress = 0.023847
slot update_slots: id  0 | task 418 | prompt done, n_past = 629, n_tokens = 15
slot      release: id  0 | task 418 | stop processing: n_past = 634, truncated = 0
slot print_timing: id  0 | task 418 |
prompt eval time =     468.93 ms /    15 tokens (   31.26 ms per token,    31.99 tokens per second)
       eval time =     608.27 ms /     6 tokens (  101.38 ms per token,     9.86 tokens per second)
      total time =    1077.20 ms /    21 tokens

문제 만들기1

질문:

1	초등 국어 문제 3개 만들어줘, 힌트 정답 해설 포함

답:

문제: “토끼가 어디 있었는지 기억해?”

힌트: ????

정답: 집에

해설: 이 문제는 간단한 주장형 문제입니다. 토끼는 ‘토끼’라는 단어의 어미가 잘못된 것임을 암시하는 문제입니다.

문제: “새로운 학교에 들어간 소년이 가방에 넣은 물건은 무엇일까요?”

힌트: ?????

정답: 스무개

해설: 이 문제는 단어의 의미와 관련된 문제입니다. ‘새로운 학교에 들어간 소년이 가방에 넣은 물건’이란 표현은 ‘가방’이라는 단어의 의미를 이용한 트릭입니다. ‘가방’에 들어가는 물건은 ‘사물’들로, 그 중에서도 ‘스무개’라는 단어의 의미가 일치합니다.

문제: “다음 글의 의미와 가장 잘 어울리는 단어는?”

힌트: ????

문제: “다음 글에서 제시된 문제를 해결하기 위해 필요한 가장 중요한 요소는 무엇일까요? 한 강아장이 주인에게 ‘뭘 먹었어?’라고 묻었다가, 그 주인은 ‘배가 부르면 배가 불어질 거예요’라고 대답했다.”

정답: 배

해설: 이 문제는 문장의 의미를 이해하고, 그 의미와 일치하는 단어를 찾는 문제입니다. 배가 부르면 배가 불어질 거예요라는 주인의 대답이 배라는 단어와 잘 어울리는 단서를 제공합니다.

처리:

slot launch_slot_: id  0 | task 425 | processing task
slot update_slots: id  0 | task 425 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 664
slot update_slots: id  0 | task 425 | kv cache rm [634, end)
slot update_slots: id  0 | task 425 | prompt processing progress, n_past = 664, n_tokens = 30, progress = 0.045181
slot update_slots: id  0 | task 425 | prompt done, n_past = 664, n_tokens = 30
slot      release: id  0 | task 425 | stop processing: n_past = 1021, truncated = 0
slot print_timing: id  0 | task 425 |
prompt eval time =    1001.50 ms /    30 tokens (   33.38 ms per token,    29.96 tokens per second)
       eval time =   43976.36 ms /   358 tokens (  122.84 ms per token,     8.14 tokens per second)
      total time =   44977.86 ms /   388 tokens

문제만들기2

질문:

1	고등학교 지구과학 문제 3개를 만들어져, 힌트, 정답과 해설을 포함해줘

답:

문제:
“다음 중 지구의 궤도에 따라서 궤도형이 변화하는 요인은 무엇일까요?”

힌트: ????

정답: 지구의 자전 속도 변화

해설: 지구의 궤도형 변화는 지구의 자전 속도 변화에 의해 발생합니다. 지구의 자전 속도가 변화하면, 지구의 자전축의 방향이 변화하여 지구의 궤도형이 변화하게 됩니다. 이로 인해 지구의 자전축이 전락하는 경우도 있습니다. 따라서 지구의 궤도형 변화는 지구의 자전 속도 변화에 의해 발생하는 요소입니다.

문제:
“다음 그림과 같은 형태의 지질학적 현상을 설명하는 데 필요한 요인은 무엇일까요?”

힌트: ????

[그림: 해양판이 서로 충돌하는 모습]

정답: 대륙형 해양판의 충돌

해설: 이 문제는 지질학적 현상을 설명하는 데 필요한 요인을 찾아야 합니다. 그림에서 볼 수 있듯이, 해양판이 서로 충돌하여 대륙 형성하는 과정을 보여주고 있습니다. 이 과정을 설명하는 데 필요한 요인은 대륙형 해양판의 충돌입니다.

문제:
“다음 단어들이 의미상 일치하는 것은 무엇일까요?”

힘, 에너지, 힘, 에너지, 힘, 에너지…

힌트: ????

정답: 물리학

해설: 이 문제는 단어들 사이의 의미 상 일치를 찾는 문제입니다. 힘과 에너지는 물리학에서 중요한 개념입니다. 물리학에서 힘과 에너지는 상호연관된 개념으로, 힘은 물체에 작용하는 외력이고, 에너지는 물체의 상태 변화를 설명하는 개념입니다. 따라서 이 단어들이 의미상 일치하는 것은 물리학입니다.

(참고로, 문제에 실제 그림이나 이미지 추가가 가능합니다. 해당 문제들은 가상으로 만든 예시입니다.)

처리:

slot launch_slot_: id  0 | task 784 | processing task
slot update_slots: id  0 | task 784 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 1057
slot update_slots: id  0 | task 784 | kv cache rm [934, end)
slot update_slots: id  0 | task 784 | prompt processing progress, n_past = 1057, n_tokens = 123, progress = 0.116367
slot update_slots: id  0 | task 784 | prompt done, n_past = 1057, n_tokens = 123
slot      release: id  0 | task 784 | stop processing: n_past = 1525, truncated = 0
slot print_timing: id  0 | task 784 |
prompt eval time =     585.00 ms /   123 tokens (    4.76 ms per token,   210.26 tokens per second)
       eval time =   59199.24 ms /   469 tokens (  126.22 ms per token,     7.92 tokens per second)
      total time =   59784.24 ms /   592 tokens

판단

질문:

1	철수는 하루에 치킨 100마리를 튀기고 민수는 하루에 치킨 60마리를 튀긴다. 누가 더 일을 잘하지?

답:

이 문제는 ‘일을 잘하는 사람’을 평가하는 기준에 따라 답이 달라질 수 있습니다. 일반적으로 일의 양을 비교하기 위해 가장 간단한 방법은, 각 사람의 일의 단위(마리, 개, …)를 기준으로 비교하는 것입니다. 따라서, 치킨의 양을 단위로 비교하면 다음과 같습니다.

철수: 하루에 치킨 100마리 튀기기
민수: 하루에 치킨 60마리 튀기기

따라서, 철수가 하루에 치킨 100마리를 튀기므로 민수보다 일을 더 많이 합니다.

처리:

slot launch_slot_: id  0 | task 1254 | processing task
slot update_slots: id  0 | task 1254 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 1573
slot update_slots: id  0 | task 1254 | kv cache rm [1462, end)
slot update_slots: id  0 | task 1254 | prompt processing progress, n_past = 1573, n_tokens = 111, progress = 0.070566
slot update_slots: id  0 | task 1254 | prompt done, n_past = 1573, n_tokens = 111
slot      release: id  0 | task 1254 | stop processing: n_past = 1708, truncated = 0
slot print_timing: id  0 | task 1254 |
prompt eval time =     535.79 ms /   111 tokens (    4.83 ms per token,   207.17 tokens per second)
       eval time =   17555.45 ms /   136 tokens (  129.08 ms per token,     7.75 tokens per second)
      total time =   18091.24 ms /   247 tokens

문장장 교정

질문:

1
2
3

다음 텍스트를 자연스럽게 교정해 줘.

이번 장에서 여러분은 커널을 디버깅을 하는 데 있어 여러 가지 접근 방법이 있다는 것을 배웠다. 우리는 어떤 상황에서 어떤 접근 방법을 사용해야 할지 빠르게 결정할 수 있도록 그런 접근 방법들을 분류도 해봤다. 모든 도구 혹은 기법이 모든 시나리오 혹은 상황에 도움이 되지 않는다는 것이 핵심 포인트 중 하나다. 예를 들어서 KASAN 같은 강력한 메모리 체커는 개발 단계 및 유닛 테스트 단계에서는 정말 유용하지만 시스템 테스트나 제품화 단계에서는 일반적으로 사용이 불가능 하다 (다(프로덕션 커널은 디버그 커널과 달리 KASAN 사용이 비활성화 되도록 환경 설정이 되기 때문이다.)

답:

이번 장에서 여러분은 커널을 디버깅하는 데 있어 여러 가지 접근 방법이 있다는 것을 배웠다. 우리는 어떤 상황에서 어떤 접근 방법을 사용해야 할지를 빠르게 결정할 수 있도록 그런 접근 방법들을 분류해봤다. 모든 도구나 기법이 모든 시나리오나 상황에 도움이 되지 않는다는 것이 핵심 포인트 중 하나다. 예를 들어, KASAN 같은 강력한 메모리 체커는 개발 단계 및 유닛 테스트 단계에서는 정말 유용하지만, 시스템 테스트나 제품화 단계에서는 일반적으로 사용이 불가능하다. (프로덕션 커널은 디버그 커널과 달리 KASAN 사용이 비활성화되도록 환경 설정이 된다.)

처리:

slot launch_slot_: id  0 | task 1391 | processing task
slot update_slots: id  0 | task 1391 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 1912
slot update_slots: id  0 | task 1391 | kv cache rm [1708, end)
slot update_slots: id  0 | task 1391 | prompt processing progress, n_past = 1912, n_tokens = 204, progress = 0.106695
slot update_slots: id  0 | task 1391 | prompt done, n_past = 1912, n_tokens = 204
slot      release: id  0 | task 1391 | stop processing: n_past = 2082, truncated = 0
slot print_timing: id  0 | task 1391 |
prompt eval time =     563.75 ms /   204 tokens (    2.76 ms per token,   361.86 tokens per second)
       eval time =   21495.76 ms /   171 tokens (  125.71 ms per token,     7.96 tokens per second)
      total time =   22059.51 ms /   375 tokens

영문 번역

질문:

1
2
3

We both worked with young moms who go completely dark for a few hours in the evening, when they are with their families and putting their kids to bed.

위 문장을 한국어로 번역해

답:

우리는 가족과 함께 아이들을 취침시키는 저녁 몇 시간 동안 완전히 어두워지는 젊은 엄마들을 함께 작업했습니다.

처리:

slot launch_slot_: id  0 | task 1563 | processing task
slot update_slots: id  0 | task 1563 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 2132
slot update_slots: id  0 | task 1563 | kv cache rm [2082, end)
slot update_slots: id  0 | task 1563 | prompt processing progress, n_past = 2132, n_tokens = 50, progress = 0.023452
slot update_slots: id  0 | task 1563 | prompt done, n_past = 2132, n_tokens = 50
slot      release: id  0 | task 1563 | stop processing: n_past = 2162, truncated = 0
slot print_timing: id  0 | task 1563 |
prompt eval time =     492.98 ms /    50 tokens (    9.86 ms per token,   101.42 tokens per second)
       eval time =    3919.04 ms /    31 tokens (  126.42 ms per token,     7.91 tokens per second)
      total time =    4412.02 ms /    81 tokens

명령 에러 처리

질문:

1	crontab -e 명령 실행 시에만 E319: Sorry, the command is not available in this version 메시지가 나온다.

답:

처리:

slot launch_slot_: id  0 | task 1595 | processing task
slot update_slots: id  0 | task 1595 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 2203
slot update_slots: id  0 | task 1595 | kv cache rm [2162, end)
slot update_slots: id  0 | task 1595 | prompt processing progress, n_past = 2203, n_tokens = 41, progress = 0.018611
slot update_slots: id  0 | task 1595 | prompt done, n_past = 2203, n_tokens = 41
slot      release: id  0 | task 1595 | stop processing: n_past = 2594, truncated = 0
slot print_timing: id  0 | task 1595 |
prompt eval time =     481.22 ms /    41 tokens (   11.74 ms per token,    85.20 tokens per second)
       eval time =   51900.49 ms /   392 tokens (  132.40 ms per token,     7.55 tokens per second)
      total time =   52381.70 ms /   433 tokens

지명과 특산물

질문:

다음 지문을 읽고 문제에 답하시오.

---

1950년 7월, 한국 전쟁 초기에 이승만 대통령은 맥아더 장군에게 유격대원들을 북한군의 후방에 침투시키는 방안을 제안했다. 이후, 육군본부는 육본직할 유격대와 육본 독립 유격대를 편성했다. 국군은 포항과 인접한 장사동 지역에 상륙작전을 수행할 부대로 독립 제1유격대대를 선정했다. 육군본부는 독립 제1유격대대에 동해안의 장사동 해안에 상륙작전을 감행하여 북한군 제2군단의 보급로를 차단하고 국군 제1군단의 작전을 유리하게 하기 위한 작전명령(육본 작명 제174호)을 하달했다. 9월 14일, 독립 제1유격대대는 부산에서 LST 문산호에 승선하여 영덕군의 장사동으로 출항했다.

1950년 9월 15일, 독립 제1유격대대는 장사동 해안에 상륙을 시도하였으나 태풍 케지아로 인한 높은 파도와 안개로 인해 어려움을 겪었다. LST 문산호는 북한군의 사격과 파도로 인해 좌초되었고, 상륙부대는 09:00시경에 전원이 상륙을 완료하였다. 그 후, 15:00시경에 200고지를 점령하였고, 다양한 무기와 장비를 노획하였다. 9월 16일과 17일에는 독립 제1유격대대가 여러 위치에서 북한군과의 전투를 벌였으며, 미 구축함과의 연락 두절로 인해 추가적인 어려움을 겪었다.

장사동에서 위급한 상황에 처한 독립 제1유격대대를 구출하기 위해 해군본부는 LT-1(인왕호)를 급파했으나, LST 문산호의 구출에 실패했다. 해군본부는 상륙부대의 철수를 지원하기 위해 LST 조치원호를 현지로 보냈다. 9월 18일, 이명흠 부대장은 유엔 해군과의 협력 하에 부족한 식량과 탄약 지원을 받았다. 9월 19일, 유엔군의 함포지원과 함께 LST 조치원호가 도착하여 철수 작전을 시작했다. 스피어 소령은 직접 해안에 상륙하여 구조작전을 지시하였다. 9월 20일, 725명이 부산항으로 복귀했으나, 32명이 장사동 해안에 남아 북한군의 포로가 되었거나 탈출하여 국군에 합류하였다.

장사리 전투가 인천 상륙작전의 양동작전으로 알려졌으나, 이 전투가 드라마틱한 요소로 인해 과장되었으며, 실제로는 인천 상륙작전과 큰 관련이 없다. 또한, 북한이나 중국의 군사적 상황을 고려할 때, 장사리에서의 전투가 낙동강 전선에 영향을 끼칠 가능성은 낮다.

---

문제
1. 지문에 나오는 지명을 모두 쓰시오.
2. 그중 대게로 유명한 곳은?

답:

지명:
- 포항
- 장사동
- 부산
- 영덕군
- 부산항
- 인천
- 장사리
- 낙동강
대게로 유명한 곳:
- 장사동

처리:

slot launch_slot_: id  0 | task 1988 | processing task
slot update_slots: id  0 | task 1988 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 3380
slot update_slots: id  0 | task 1988 | kv cache rm [2594, end)
slot update_slots: id  0 | task 1988 | prompt processing progress, n_past = 3380, n_tokens = 786, progress = 0.232544
slot update_slots: id  0 | task 1988 | prompt done, n_past = 3380, n_tokens = 786
slot      release: id  0 | task 1988 | stop processing: n_past = 3443, truncated = 0
slot print_timing: id  0 | task 1988 |
prompt eval time =    1318.08 ms /   786 tokens (    1.68 ms per token,   596.32 tokens per second)
       eval time =    8644.67 ms /    64 tokens (  135.07 ms per token,     7.40 tokens per second)
      total time =    9962.75 ms /   850 tokens

강수량과 그 영향

질문:

1	겨울철 강수량이 그 다음 해의 농수산물 수확량에 미치는 영향은?

답:

겨울철 강수량은 그 다음 해의 농수산물 수확량에 미치는 영향은 크게 두 가지로 나눌 수 있습니다:

영양 공급:
- 겨울철 강수량이 충분하면 토양의 수분 상태가 안정되며, 봄철 심화 작업을 할 때 필요한 물이 충분히 공급됩니다. 이는 식물의 성장에 필요한 수분과 영양분을 보다 충분히 공급할 수 있습니다. 이는 특히 겨울철에 고정산(예: 사탕수수, 벼)을 심는 경우에서 중요합니다.
병해충 관리:
- 충분한 강수량은 병해충의 번식과 생장에 영향을 미칩니다. 예를 들어, 많은 병해충이 건조한 상태에서 번식하게 되므로, 겨울철 강수량이 충분하면 병해충의 발병이 줄어들 수 있습니다. 이는 작물의 수확량과 질을 보다 높이는 데 도움이 됩니다.

그러나, 너무 많은 강수량은 문제를 일으킬 수도 있습니다. 과도한 강수량은 토양의 유실을 유발할 수 있으며, 이는 농작물의 성장에 부정적인 영향을 미칠 수 있습니다. 따라서, 농업 생산성에 긍정적인 영향을 미치는 적절한 강수량이 필요한 것입니다.

따라서, 겨울철 강수량은 그 다음 해의 농수산물 수확량에 긍정적인 영향을 미칠 수 있지만, 과도한 강수량은 부정적인 영향을 미칠 수 있습니다.

처리:

slot launch_slot_: id  0 | task 2053 | processing task
slot update_slots: id  0 | task 2053 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 3477
slot update_slots: id  0 | task 2053 | kv cache rm [3443, end)
slot update_slots: id  0 | task 2053 | prompt processing progress, n_past = 3477, n_tokens = 34, progress = 0.009779
slot update_slots: id  0 | task 2053 | prompt done, n_past = 3477, n_tokens = 34
slot      release: id  0 | task 2053 | stop processing: n_past = 3840, truncated = 0
slot print_timing: id  0 | task 2053 |
prompt eval time =     536.93 ms /    34 tokens (   15.79 ms per token,    63.32 tokens per second)
       eval time =   50936.36 ms /   364 tokens (  139.94 ms per token,     7.15 tokens per second)
      total time =   51473.29 ms /   398 tokens

라니냐 발생 가능성

질문:

1	2024년 겨울에 라니냐가 발생할 수 있을것 같아?

답: 중단됨

2024년 겨울에 라니냐(La Niña)가 발생할 가능성이 있는지에 대한 예측은 현재로서는 불확실합니다. 라니냐는 태평양 남부의 수온과 대기 압력 패턴이 특정한 방식으로 변형되는 현상으로, 전 세계 기후와 기상 조건에 영향을 미칩니다. 이러한 현상은 전 세계적으로 일관된 예측 시스템이 개발되기 어려운 특성을 가지고 있기 때문에, 예측은 매우 복잡하고 불확실성이 큽니다.

라니냐의 발생 가능성을 예측하는 것은 다양한 기상학적 모델과 지질학적 관찰을 통해 이루어지며, 이에 따라 세계 기상 기구는 라니냐의 발생 가능성을 매년 예측합니다. 그러나 이러한 예측은 다년간의 변동성을 가지고 있어, 정확한 예측을 하기 어렵습니다.

따라서, 2024년 겨울에 라니냐가 발생할 가능성에 대한 정보는 현재로서는

처리:

slot launch_slot_: id  0 | task 2418 | processing task
slot update_slots: id  0 | task 2418 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 3868
slot update_slots: id  0 | task 2418 | kv cache rm [3840, end)
slot update_slots: id  0 | task 2418 | prompt processing progress, n_past = 3868, n_tokens = 28, progress = 0.007239
slot update_slots: id  0 | task 2418 | prompt done, n_past = 3868, n_tokens = 28
slot update_slots: id  0 | task 2418 | slot context shift, n_keep = 1, n_left = 4094, n_discard = 2047
/mnt/d/DeepSeek_R1/llama.cpp/ggml/src/ggml-cuda/cpy.cu:504: ggml_cuda_cpy: unsupported type combination (q4_0 to f32)

srv  cancel_tasks: cancel task, id_task = 2418

여기서 중단되어 보여서 재시작후 다음 질문을 진행했다.

경제 이론

질문:

1	현대 화폐 이론에 대해서 설명해줘

답:

현대 화폐 이론은 화폐의 경제적 역할과 기능을 분석하는 학문 분야를 의미합니다. 화폐는 단순히 상품 교환 수단 이상으로, 경제적 시스템의 핵심 구성 요소로 작용합니다. 현대 화폐 이론은 화폐의 생성, 분배, 사용, 그리고 화폐 시스템의 안정성과 효율성을 다루는 학문 분야입니다. 다음은 주요 개념과 이론들을 설명한 내용입니다.

화폐의 생성:
- 중앙화폐 시스템:
  - 중앙은행이 화폐를 보조하는 중앙화폐 시스템은 화폐의 수요를 조절하고, 공급을 관리하는 방식입니다. 이는 인플레이션과 디플레이션을 막아야 하며, 중앙은행의 통제력을 통해 경제적 안정성을 유지합니다.
- 프라이빗화폐 시스템:
  - 프라이빗 은행들이 화폐를 발행하는 프라이빗화폐 시스템은 시장에서 화폐의 수요를 조절하며, 시장의 효율성을 극대화합니다. 그러나 이는 중앙은행의 통제력이 약화될 수 있으며, 금융 불안정성을 초래할 수 있습니다.
화폐의 분배:
- 공급와 수요의 균형:
  - 화폐의 공급과 수요의 균형이 중요한 문제입니다. 화폐의 과잣 공급은 인플레이션을 유발하며, 과소 공급은 디플레이션을 유발합니다. 중앙은행은 이를 조절하기 위해 다양한 정책을 채택합니다.
화폐의 사용:
- 화폐의 저장 가치:
  - 화폐는 단기적으로나 장기적으로 사용할 수 있는 가치를 가집니다. 화폐의 가치는 인플레이션과 디플레이션에 따라 변동하며, 이는 화폐의 사용 효율성에 영향을 미칩니다.
- 화폐의 상대 가치:
  - 화폐의 상대 가치는 시간이 지나면서 변동할 수 있으며, 이는 인플레이션과 디플레이션의 결과입니다. 상대 가치의 변동은 소비자와 생산자의 결정에 영향을 미칩니다.
화폐 시스템의 안정성과 효율성:
- 안정성:
  - 화폐 시스템의 안정성은 화폐의 공급과 수요의 균형, 그리고 화폐의 가치 변동을 통해 평가됩니다. 안정적인 화폐 시스템은 경제적 불안정성을 최소화합니다.
- 효율성:
  - 화폐의 효율성은 화폐가 경제적 자원 배분에 얼마나 효과적으로 사용되는지를 의미합니다. 효율적인 화폐 시스템은 자원 배분의 효율성을 극대화합니다.

현대 화폐 이론은 이러한 다양한 요소를 고려하여 화폐의 역할과 기능을 분석하고, 경제적 안정성과 효율성을 유지하는 방안을 모색합니다. 이를 통해 화폐가 경제적 시스템의 중요한 역할을 다하고, 경제적 발전과 안정성을 도모합니다.

처리:

slot launch_slot_: id  0 | task 0 | processing task
slot update_slots: id  0 | task 0 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 4152
slot update_slots: id  0 | task 0 | input truncated, n_ctx = 4096, n_keep = 0, n_left = 4096, n_prompt_tokens = 2104
slot update_slots: id  0 | task 0 | kv cache rm [0, end)
slot update_slots: id  0 | task 0 | prompt processing progress, n_past = 2048, n_tokens = 2048, progress = 0.973384
slot update_slots: id  0 | task 0 | kv cache rm [2048, end)
slot update_slots: id  0 | task 0 | prompt processing progress, n_past = 2104, n_tokens = 56, progress = 1.000000
slot update_slots: id  0 | task 0 | prompt done, n_past = 2104, n_tokens = 56
slot      release: id  0 | task 0 | stop processing: n_past = 2815, truncated = 1
slot print_timing: id  0 | task 0 |
prompt eval time =    2778.84 ms /  2104 tokens (    1.32 ms per token,   757.15 tokens per second)
       eval time =   95351.01 ms /   712 tokens (  133.92 ms per token,     7.47 tokens per second)
      total time =   98129.84 ms /  2816 tokens

크롤링

질문:

1	have you got any crawling ability from some url?

답:

I’m not capable of crawling URLs or collecting data from websites. I’m an AI designed to provide information and answer questions based on my training data, but I don’t have the ability to perform web scraping or crawling. Additionally, I comply with the terms of service and applicable laws, including those related to data privacy and intellectual property.

처리:

slot launch_slot_: id  0 | task 714 | processing task
slot update_slots: id  0 | task 714 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 4883
slot update_slots: id  0 | task 714 | input truncated, n_ctx = 4096, n_keep = 0, n_left = 4096, n_prompt_tokens = 2835
slot update_slots: id  0 | task 714 | kv cache rm [2815, end)
slot update_slots: id  0 | task 714 | prompt processing progress, n_past = 2835, n_tokens = 20, progress = 0.007055
slot update_slots: id  0 | task 714 | prompt done, n_past = 2835, n_tokens = 20
slot      release: id  0 | task 714 | stop processing: n_past = 2902, truncated = 1
slot print_timing: id  0 | task 714 |
prompt eval time =     786.86 ms /    20 tokens (   39.34 ms per token,    25.42 tokens per second)
       eval time =    9169.41 ms /    68 tokens (  134.84 ms per token,     7.42 tokens per second)
      total time =    9956.27 ms /    88 tokens

외부 파일 처리 여부

질문:

1	너는 외부 텍스트 파일을 읽고 질문에 답해 줄 수 있어?

답:

네. 외부 텍스트 파일을 읽고 질문에 답변을 제공하는 기능은 제가 수행할 수 있습니다. 그러나, 이 기능을 사용하려면 다음과 같은 제한이 있습니다:

권한 문제: 외부 파일을 읽고 처리하는 과정에서 데이터의 소유권 및 사용권이 명확해야 합니다.
보안 문제: 외부 파일이 악의적으로 사용될 수 있으므로, 데이터의 보안과 개인정보 보호를 고려해야 합니다.
법적 문제: 특정 법적 제한이나 지적 재산권 문제가 있는 경우에는 처리할 수 없습니다.

외부 텍스트 파일을 읽고 질문에 답변을 제공할 수 있는 경우, 파일이 명시적으로 공개되거나 저작권 문제가 없는 경우에 한해 사용할 수 있습니다. 파일이 저작권 문제를 포함하거나, 개인정보나 민감한 데이터를 포함하는 경우에는 처리할 수 없습니다.

처리:

slot launch_slot_: id  0 | task 783 | processing task
slot update_slots: id  0 | task 783 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 4978
slot update_slots: id  0 | task 783 | input truncated, n_ctx = 4096, n_keep = 0, n_left = 4096, n_prompt_tokens = 2930
slot update_slots: id  0 | task 783 | kv cache rm [2902, end)
slot update_slots: id  0 | task 783 | prompt processing progress, n_past = 2930, n_tokens = 28, progress = 0.009556
slot update_slots: id  0 | task 783 | prompt done, n_past = 2930, n_tokens = 28
slot      release: id  0 | task 783 | stop processing: n_past = 3131, truncated = 1
slot print_timing: id  0 | task 783 |
prompt eval time =    1107.79 ms /    28 tokens (   39.56 ms per token,    25.28 tokens per second)
       eval time =   27565.01 ms /   202 tokens (  136.46 ms per token,     7.33 tokens per second)
      total time =   28672.80 ms /   230 tokens

질문:

1	너는 pdf 파일을 읽고 질문에 답해 줄 수 있어?

답:

저는 pdf 파일을 직접 읽고 질문에 답해 줄 수 없습니다. pdf 파일을 읽고 이해하는 과정은 인공지능 기술에서 매우 복잡하며, 현재의 인공지능 기술로는 직접 pdf 파일을 읽고 이해하는 것은 제한적입니다. 그러나, pdf 파일의 텍스트를 추출하고 해당 텍스트를 기반으로 질문에 답할 수 있습니다. pdf 파일에서 텍스트를 추출하기 위해서는 pdf 파일을 이미지에서 텍스트로 변환하는 추가적인 작업이 필요할 수 있습니다. 이 과정에서 사용되는 기술들은 OCR(광학적 인식 기술) 등을 포함할 수 있습니다. OCR은 이미지를 텍스트로 변환하는 기술로, pdf 파일을 OCR을 통해 텍스트로 변환한 후 이를 분석하여 질문에 답할 수 있습니다.

처리:

slot launch_slot_: id  0 | task 986 | processing task
slot update_slots: id  0 | task 986 | new prompt, n_ctx_slot = 4096, n_keep = 0, n_prompt_tokens = 5204
slot update_slots: id  0 | task 986 | input truncated, n_ctx = 4096, n_keep = 0, n_left = 4096, n_prompt_tokens = 3156
slot update_slots: id  0 | task 986 | kv cache rm [3131, end)
slot update_slots: id  0 | task 986 | prompt processing progress, n_past = 3156, n_tokens = 25, progress = 0.007921
slot update_slots: id  0 | task 986 | prompt done, n_past = 3156, n_tokens = 25
slot      release: id  0 | task 986 | stop processing: n_past = 3331, truncated = 1
slot print_timing: id  0 | task 986 |
prompt eval time =    1003.58 ms /    25 tokens (   40.14 ms per token,    24.91 tokens per second)
       eval time =   24281.49 ms /   176 tokens (  137.96 ms per token,     7.25 tokens per second)
      total time =   25285.07 ms /   201 tokens

2024-12-23 게시 됨2024-12-23 업데이트 됨AI35분안에 읽기 (약 5197 단어)

[요약] Image Segmentation

Image Segmentation:

https://storm.genie.stanford.edu/article/image-segmentation%0A-410216

이미지 분할(Image Sementation)의 주요 목적은 특정 영역 분리와 식별이다. 이미지 안의 여러 사물에서 관심 영역을 분리함으로써 사용자는 관련 정보를 추출하고 해당 영역을 정량적으로 분석할 수 있게 된다.

이미지 분할 (Image Sementation) 이란

이미지 분할 (Segmentation) 은 이미지 안의 개체를 분석에 필요한 대상을 다중 분할 또는 영역으로 나누는데 관련한 컴퓨터 비전과 인공지능의 중대한 기술이다.

이미지에 있는 뚜렷한 객체 또는 특성을 식별하고 분리하기 위해서 세그멘테이션은 의료 이미지에서 자동차까지 다양한 응용분야에서 성장했다.

이미지의 공간적 구조와 구성에 대한 자세한 정보를 제공하는 기능은 컴퓨터 비전에서 주목할 만한 분야로, 의료, 감시 및 엔터테인먼트 등의 산업 전반에 사용되고 있다.

이미지 분할의 진화는 1950년대와 1960년대의 초기 방법에서 시작하여 현대 기술의 토대를 마련한 몇 가지 중요한 단계를 거쳐 추적할 수 있다. [1][2]

이 분야는 1990년대 디지털 혁명 동안 디지털 이미지와 계산 능력의 증가로 인해 상당한 발전을 이루었다. 이는 2000년대와 2010년대에 정점을 이루었고, 특히 합성곱 신경망(CNN)과 같은 딥 러닝의 출현으로 이미지 분할 기능이 변형되어 이미지 내의 복잡한 패턴과 객체를 인식하는 데 있어 전례 없는 정확성과 효율성을 이루었다. [2] [3]

기술의 발전에 따라 이미지 분할은 감시와 얼굴 인식에서 윤리적 우려, 프라이버시 등의 의문이 제기되고 또한 데이터 가변성, 폐색 및 고급 알고리즘의 높은 계산 요구 사항과 같은 문제는 효과적인 구현에 대한 상당한 장애물로 계속 남아 있다.[1][3]

헬름홀츠의 무의식적 추론 이론

19세기의 헤르만 폰 헬름홀츠는 우리가 보는 것은 단순히 망막에 맺힌 이미지가 아니라 뇌가 경험과 지식을 바탕으로 재구성한 결과라는 것이이다. 시각이론은 컴퓨터 비전 시스템이 상황 정보, 사전 지식, 추론 능력 등을 활용해야 함을 시사했습니다. [A4]

초기 1950년대~1960년대

1950년대에서 1960년대는 컴퓨터 비전과 인공 지능(AI)의 시작 단계였다. AI가 학문 분야로 공식적으로 확립된 시기였으며, 특히 존 매카시와 마빈 민스키와 같은 선구자들이 조직한 1956년 다트머스 컨퍼런스가 주요 성과였다. [1]

AI 초기 연구는 기계에 시각 데이터를 “보고” 해석하는 능력을 부여하는 데 중점을 두었으며, 이는 이미지 처리 및 세분화 기술의 미래 발전을 위한 토대를 마련했습니다.

디지털 이미지 처리는 1960년대에 이미지를 디지털 형식으로 변환하여 컴퓨터 처리가 가능해졌다. 1963년 MIT의 Larry Roberts는 2차원 이미지에서 3차원 장면을 재구성하는 알고리즘을 도입하여 이 분야를 발전시켰습니다. 이러한 발전으로 컴퓨터는 이미지 데이터를 분석하고 해석할 수 있게 되었습니다. [A3]

James Cooley와 John Tukey가 1965년에 개발한 고속 퓨리에 변환(FFT) 알고리즘 개발하였고, FFT는 이미지와 같은 신호를 공간 영역에서 주파수 영역으로 변환하는 이산 퓨리에 변환(DFT)을 효율적으로 계산한다. 컴퓨터 비전에서 FFT를 활용하여 이미지 필터링, 노이즈 감소, 특징 추출과 같은 필수 작업을 수행할 수 있다.

성장과 도전 1980년대

DARPA 등 지원으로 연구자들은 이미지 분할의 기본 구성 요소인 객체 인식 및 장면 이해와 관련된 복잡한 과제를 해결하기 시작다. 그러나 당시 기술은 제한적이었으며 많은 시스템이 조명, 크기 및 관점의 변화로 인해 객체를 정확하게 식별하는 데 어려움을 겪었습니다.[1]

디지털 혁명 1990년대

1990년대는 디지털 카메라의 등장과 인터넷의 급속한 확장을 특징으로 하는 디지털 혁명으로 시각 데이터의 가용성이 기하급수적으로 증가하면서 컴퓨터 비전에서 디지털 이미지의 알고리즘을 훈련하기 위한 풍부한 데이터 세트를 제공되며 이미지 분할 방법론의 역량을 향상시켰다. 특히 객체 인식 및 특징 추출 기술에 대한 추가 연구 개발을 촉진했습니다. [2]

빅데이터와 딥러닝의 부상(2000년대-2010년대)

2000년대는 빅데이터와 강력한 컴퓨팅 리소스에 의해 합성곱 신경망(CNN)의 도입으로 이미지 처리의 풍경을 변화시켜 시각적 인식 작업의 속도와 정확도를 크게 향상시켰습니다.[ 2 ]

2010년대에는 딥 러닝 혁명이 이미지 분할 기술을 더욱 발전시키며 얼굴 인식 시스템 및 자율 주행차를 포함한 다양한 분야에서 이미지 분할이 실질적으로 적용되었다.

2012년에 CNN 기반 접근 방식이 ImageNet Large Scale Visual Recognition Challenge(ILSVRC)에서 놀라운 성공을 거두면서 이미지 인식 작업에서 딥 러닝의 혁신적 힘을 강조하면서 분수령이 발생했습니다. [1]

현대적 이슈와 미래 방향

이미지 분할 기술이 발전함에 따라 특히 감시 및 얼굴 인식 응용 분야의 맥락에서 윤리 및 개인 정보 보호 문제도 제기되었습니다.[ 1 ]

이러한 기술의 의미를 둘러싼 지속적인 논쟁은 기술 발전과 개인의 권리를 균형 있게 유지하는 책임 있는 혁신의 필요성을 강조합니다. 앞으로 적대적 훈련 및 전이 학습을 포함한 새로운 방법의 지속적인 개발은 이미지 분할 연구와 실제 세계 응용 분야에 대한 흥미로운 미래를 예고합니다.[ 1 ] [ 3 ]

방법

방법은 전통적인 기술과 딥 러닝 프레임워크를 사용하는 기술로 크게 분류할 수 있습니다.

영역 확장 Region-growing method

영역 확장 방법은 영역 내의 이웃 픽셀이 유사한 강도 값을 공유해서 시드 픽셀을 선택하고 유사성 기준을 충족하는 이웃 픽셀을 추가하여 영역을 확장하는 방법이다.

https://users.cs.cf.ac.uk/dave/Vision_lecture/node35.html

시드 영역 확장(SRG) 기술은 미리 정해진 시드 포인트를 사용하여 강도 유사성에 따라 영역을 반복적으로 확장하는 반면, 시드되지 않은 영역 확장 방법은 단일 픽셀로 시작하여 임계값 비교에 따라 새로운 영역을 만듭니다. [4][5]

임계값 설정 Thresholding

임계값 설정은 임계값을 사용하여 픽셀을 여러 클래스로 구분하는 기본 기술로, 객체 감지 및 특징 추출과 같은 작업을 가능하게 합니다.

https://encord.com/blog/image-thresholding-image-processing/

간단한 임계값 설정은 전역 임계값을 기반으로 각 픽셀에 이진 값을 할당하지만 다양한 조명 조건에서 어려움을 겪을 수 있습니다. 적응형 임계값 설정은 로컬 특성에 따라 각 픽셀의 임계값을 조정하여 복잡한 이미지의 분할을 개선합니다. [6]

Motion-based Segmentation

동작 기반 분할 기술은 일련의 이미지에서 동작 정보를 얻기 위해서 프레임 간의 차이점을 분석해서 움직이는 객체를 정적 배경에서 분리할 수 있습니다.

https://www.sciencedirect.com/topics/engineering/motion-segmentation

대화형 분할은 로봇 시스템을 활용하여 효과적인 분할에 필요한 동작 신호를 생성함으로써 이를 더욱 향상시킵니다.[7]

딥러닝 U-Net 및 변형

u-net은 이미지를 빠르고 정확하게 분할하기 위한 합성곱 네트워크 아키텍처입니다. 원래 생물의학 이미지 분할을 위해 설계되어 이 분야의 기초 아키텍처가 되었다. 지금까지 전자 현미경 스택의 신경 구조 분할을 위한 ISBI 챌린지 에서 이전의 가장 좋은 방법(슬라이딩 윈도우 합성곱 네트워크)보다 더 나은 성과를 보였습니다. [A]

ISBI 2015에서 바이트윙 방사선 촬영에서 우식의 컴퓨터 자동 감지를 위한 그랜드 챌린지에서 우승했으며 , ISBI 2015에서 두 가지 가장 어려운 투과광 현미경 범주(위상차 및 DIC 현미경)에서 세포 추적 챌린지 에서 큰 차이로 우승했습니다 (또한 당사의 발표 참조 ).[A2]

U-Net 는 스킵 연결을 통해 공간 정보를 보존하면서 컨텍스트를 캡처하는 인코더-디코더 구조로 구성됩니다.

- https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

U-Net 모델의 변형 및 향상은 의료 이미지 분할 연구에서 널리 퍼져 있으며, 종종 다양한 애플리케이션에서 성능이 향상됩니다.[5][6]

딥러닝 3D-CNN 및 Transformer 아키텍처

최근 이미지 분할의 발전으로 3D-CNN 및 Transformer 아키텍처를 기반으로 하는 모델은 체적 데이터 처리에서 강력한 성능을 보여주지만 일반적으로 상당한 계산 리소스가 필요합니다. 반면 Transformer 모델은 분할 도메인 내에서 혁신할 수 있는 잠재력으로 주목을 받고 있으며 복잡한 데이터 세트를 처리하는 새로운 접근 방식을 제공합니다. [8]

결합된 분류기 (Combind Classifier) 접근 방식

여러 분류기의 통합은 세분화 정확도를 향상시키기 위해 제안되었습니다. 이 방법은 다양한 분류 알고리즘의 강점을 활용하여 인식 및 세분화 품질을 개선합니다.

의사결정 융합 전략의 계층 구조

- A Survey of Decision Fusion and Feature Fusion Strategies for Pattern Classification

다양한 분류기의 결과를 결합함으로써 세분화 결과는 입력 데이터의 노이즈 및 변동성에 대해 더 큰 견고성을 얻을 수 있습니다. [7][5]

평가지표

주요 지표에는 정밀도, 재현율, 정확도, F1 점수, Intersection over Union(IoU), Boundary F1 점수 등이 있습니다. 이 항목 외에도,

알고리즘 학습과 실행에 필요한 시간을 모두 포함하는 분할 방법의 계산 효율성을 평가하는 것이 필수적입니다.[7]
세분화 방법은 성능에 대한 포괄적인 평가를 보장하기 위해 정밀도, 재현율, 정확도 및 효율성 요소를 기준으로 비교해야 합니다.[7]
또한 연구자들은 전문가 지식을 주석 품질에 통합하고 Dice 계수와 같은 기존 방법을 넘어서는 새로운 지표를 개발하는 것과 같이 세분화 정확도의 더 복잡한 측면을 포착하기 위해 평가 지표를 지속적으로 개선하고 있습니다.[11]

도전 과제

이미지 분할은 실제 시나리오에서 효과성과 적용성을 방해하는 다양한 과제에 계속 직면하고 있습니다. 이러한 과제는 데이터 가변성과 관련된 문제부터 분할 알고리즘의 계산적 요구 사항까지 다양합니다.

Partial occlusion

이미지에서 물체의 부분적 폐색 현상이다. 여러 프레임으로 이루어진 이미지에서 장애물로 인해 물체의 일부만 보니는 현상이다.

A Novel Particle Filter Implementation for a Multiple-Vehicle Detection and Tracking System Using Tail Light Segmentation

이는 명확한 경계를 정의하는 작업을 복잡하게 만들어 크기, 모양 및 특징 측정에 오류가 발생하는 경우가 많습니다.[6]

여러 개체 포함시 임계값 조정 문제

또한 이미지에 다양한 모양, 크기 및 강도를 가진 여러 개체 유형을 포함하는 경우 다양한 개체에 대한 임계값을 조정하는 것이 복잡할 수 있으므로 상당한 어려움을 나타냅니다.[6]

- https://bioimagebook.github.io/chapters/2-processing/3-thresholding/thresholding.html

조명 및 컨텍스트 가변성

다양한 조명 조건도 효과적인 분할에 상당한 어려움을 줍니다. 고르지 않거나 균일하지 않은 조명에서 촬영한 이미지는 물체가 배경과 효과적으로 분리되지 않을 수 있으므로 부정확할 수 있습니다. [6]

- A Low-Light Image Enhancement Method Based on Image Degradation Model and Pure Pixel Ratio Prior

또한 이미지 내에서 점진적인 강도 전환이 존재하면 기존 방법은 일반적으로 잘 정의된 모서리에 최적화되어 있기 때문에 정확한 분할을 달성하기 어려울 수 있습니다.[6]

높은 계산 능력

또 다른 중요한 장애물은 많은 고급 세분화 기술, 특히 훈련 단계에서 필요한 높은 연산 능력입니다. 이러한 높은 연산 오버헤드는 빠른 응답이 중요한 실시간 처리 시나리오에서 특정 방법의 적용성을 제한할 수 있습니다.[ 9 ]

모델 가지치기, 양자화 및 GPU나 TPU와 같은 특수 하드웨어 가속기 활용과 같은 기술은 이러한 제한을 완화하는 데 도움이 될 수 있지만 상당한 리소스에 대한 필요성은 여전히 장애물로 남아 있습니다.[ 9 ]

AI 윤리 고려

투명하고 윤리적이며 책임감 있는 AI 구현은 환자의 신뢰와 안전을 유지하는 데 매우 중요합니다.

데이터 프라이버시: AI 모델 훈련에는 대량의 환자 데이터가 필요하며, 이러한 데이터는 개인의 민감한 건강 정보를 포함하고 있습니다. 따라서 데이터 프라이버시를 보호하는 것은 매우 중요하며, 데이터 익명화, 접근 제어, 보안 강화 등의 조치가 필요합니다. [19]
훈련 데이터의 편향: AI 모델은 훈련 데이터의 편향을 반영할 수 있으며, 이는 특정 인종, 성별, 사회경제적 배경의 환자에게 불공정한 결과를 초래할 수 있습니다. 따라서 다양하고 대표적인 데이터 세트를 사용하여 훈련 데이터의 편향을 최소화하고, 공정성을 확보하는 것이 중요합니다. [19]
AI 기반 결정의 해석 가능성: 심층 학습 모델은 종종 “블랙 박스”로 여겨지며, 의사 결정 과정을 이해하기 어려울 수 있습니다. 의료 분야에서는 의사가 AI 모델의 결정을 이해하고 신뢰할 수 있어야 하므로, 설명 가능한 AI(XAI) 기술 개발이 중요합니다. 설명 가능한 AI는 AI 모델의 의사 결정 과정을 투명하게 공개하고, 의료 전문가가 AI 모델의 판단 근거를 이해하고 검증할 수 있도록 지원합니다. [19]

미래 방향

이미지 분할 분야의 개선 및 혁신 분야에 초점을 맞춰 이미지 분할의 잠재적인 미래 방향을 논의합니다.

딥러닝 통합

미래 연구의 유망한 방향은 세분화 성능을 향상시키기 위해 다양한 딥 러닝 모델을 결합하는 것입니다. 신경망 아키텍처의 지속적인 발전은 하이브리드 모델이 여러 접근 방식의 강점을 활용하여 더 우수한 결과를 제공할 수 있음을 시사합니다. 이러한 통합은 다양한 영상 조건 및 모달리티에 더 적합한 보다 견고하고 일반화 가능한 세분화 알고리즘의 개발로 이어질 수 있습니다.[17][8]

크로스 도메인 적응

교차 도메인 세분화는 여전히 중요한 과제로 남아 있으며, 특히 영상 기술의 변화가 성능에 상당한 영향을 미칠 수 있는 의료 영상 분야에서 그렇습니다. 향후 연구에서는 도메인 이동의 영향을 완화하고 다양한 데이터 세트에서 세분화 모델의 효능을 개선하는 것을 목표로 하는 새로운 도메인 적응 기술을 탐색할 수 있습니다. [8]

연구자들은 보다 풍부한 맥락적 이해를 제공하고 향상된 세분화 정확도로 이어질 수 있는 다중 모달 이미징 데이터의 통합을 조사하도록 권장됩니다.[18]

실시간 처리

실시간 처리 기능에 대한 수요는 특히 자율 주행차 및 의료 진단과 같은 애플리케이션에서 증가하고 있습니다. 미래의 이미지 분할 프레임워크는 정확도를 손상시키지 않으면서 실시간 실행을 위한 알고리즘 최적화에 집중해야 합니다 이를 위해서는 실시간 분석의 높은 요구 사항을 처리할 수 있는 보다 효율적인 계산 모델을 개발해야 합니다. [1]

학제간 시너지(Synergy with Other AI Domain)

이미지 분할과 자연어 처리(NLP) 및 증강 현실과 같은 다른 AI 기술의 교차점은 혁신을 위한 비옥한 토양을 제공합니다. 시스템이 시각 데이터와 인간 언어를 모두 해석하고 이해할 수 있도록 함으로써 연구자는 사용자 상호 작용 및 의사 결정 프로세스를 향상시키는 보다 포괄적인 AI 애플리케이션을 만들 수 있습니다. [1]

설명 가능한 (Explainable) AI

AI가 의료 분야에 계속 침투함에 따라 설명 가능한 AI에 대한 필요성이 가장 중요해졌습니다. 세분화 기술의 미래 발전은 투명성을 우선시해야 하며, 의료 전문가가 진단 프로세스를 주도하는 알고리즘을 이해하고 신뢰할 수 있도록 해야 합니다. 설명 가능성에 대한 이러한 초점은 의학과 같은 민감한 분야에서 AI 기술을 책임감 있게 배포하는 데 매우 중요할 것입니다. [19]

참고

[4] 이미지 분할 - 위키피디아, https://en.wikipedia.org/wiki/Image_segmentation

[5] 의미론적 이미지 분할의 최근 진전 - arXiv.org: https://arxiv.org/abs/1809.10198

[6] 이미지 처리에서의 이미지 임계값 설정 - Encord: https://encord.com/blog/image-thresholding-image-processing/

[7] …대한 이미지 분할 알고리즘의 성능 평가: https://www.academia.edu/88049601/미시적 이미지 데이터에 대한 이미지 분할 알고리즘의 성능 평가

[8] 뇌 의학적 분야에서 여러 영역의 과제를 해결하기 위한 접근법 탐구 : https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2024.1401329/full

[11] 컴퓨터 비전에서의 이미지 분할 가이드: 모범 사례 - Encord : https://encord.com/blog/image-segmentation-for-computer-vision-best-practice-guide/

[17] An overview of intelligent image segmentation using active contour models: https://www.oaepublish.com/articles/ir.2023.02

[19] Medical Image Segmentation and Its Real-World Applications: https://medium.com/@jervisaldanha/medical-image-segmentation-and-its-real-world-applications-unet-and-beyond-9cd06eeebcb6

[A1] ISBI 2015, http://brainiac2.mit.edu/isbi_challenge/
[A2] http://lmb.informatik.uni-freiburg.de/people/ronneber/isbi2015/
[A3] “Machine Perception of Three-Dimensional Solids”, Larry Roberts, : https://bit.ly/3ZPSBHF
[A4] “The Dawn of Computer Vision:”, https://www.turingpost.com/p/cvhistory2

2023-01-15 게시 됨2023-01-15 업데이트 됨AI33분안에 읽기 (약 4938 단어)

[요약] 영상 분야에서의 인공지능 발달 단계에 따른 데이터와 모델의 변화

다음 2개의 글을 요약하고 설명을 추가로 검색해 요약해 두었다.

인공지능 학습용 영상 데이터 기술 동향, IITP 주간기술동향 1988호, 임철홍
영상 분야에서의 인공지능 발달 단계에 따른 데이터와 모델의 변화, IITP 주간기술동향 2071호, 김혜진_한국전자통신연구원 책임연구원

2023/01/15 요약 작성

[요약] 영상 분야에서의 인공지능 발달 단계에 따른 데이터와 모델의 변화

IITP 주간기술동향 2071호등록자 / 영상 분야에서의 인공지능 발달 단계에 따른 데이터와 모델의 변화

김혜진_한국전자통신연구원 책임연구원

I. 발전

1세대

1950년대에서 80년대에 이르기까지의 규칙ㆍ지식에 기반을 둔 추론 시스템

2세대

제프리 힌튼(Geoffrey Hinton)과 얀 리쿤(Yann LeCun), 요슈아 벤지오(Yoshua Bengio)에 의해 시작된 특정 문제에 국한된 데이터셋으로부터 학습을 통해 습득하는 AI 2세대라 할 수 있다

3세대

범용적인 문제를 해결할 수 있는 인공지능

인공지능 하이프 사이클

II. AI 2세대의 데이터

최근 2세대 AI 들은 널리 알려진 형태로, 다양한 분야에서 데이터를 모으려는 노력을 바탕으로 발전되고 있다. 다양한 공개 데이터세트를 비교해 공개된 데이터셋에서 성능에 대한 비교를 포함하는 것이 거의 필수 요소가 되었다.

이미지 분류 데이터 세트

인공지능 학습용 영상 데이터 기술 동향, IITP, 주간기술동향 1988 에 정리

MNIST

숫자 10종류에 대해 7만 장의 이미지로 구성되어 있다
ImageNet

영상 downstream task에서 pretrained network로 사용되고 있는 데이터셋 중 하나로, 1,000종류, 14,197,122의 이미지로 구성되어 있다.
CIFAR

CIFAR-10, CIFAR-100으로 각각 10종류, 600장과 100종류,60,000장의 이미지가 있다

영상에서 객체 검출 데이터 세트

이미지의 상황을 이해하여 캡션 등을 자동으로 생성하기 위한 연구가 진행되면서 다중 객체 인식을 기반으로 장면 설명, 객체 간의 관계 등의 데이터가 필요하게 되었다

MS COCO[1], PASCAL VOC 2012[2] 등이 객체 검출을 목적으로 구축된 데이터셋이다.
구글 Open Image
STANDFORD와 YAHOO의 Visual Genome

객체 검출 알고리즘으로 널리 알려진 R-CNN, YOLO 계열의 알고리즘들도 모두 이 데이터셋을 기반으로 개발되었다.[1][2]

MS COCO (Common Object in COntext)

이미지의 객체 인식, 분할, 캡션 인식을 위한 공개된 데이터 셋이다. 330,000개의 이미지에서 80개 분류 1,500,000개의 객체 인스턴스를 가지고 있다. Flickr의 이미지를 기반으로 학습과 테스트가 진행되었다

COCO 홈페이지 데이터 셋 메뉴에서 explorer를 선택하면 직접 데이터 셋을 볼 수가 있는데, 위 그림 처럼 선택된 분류 객체가 분할된 이미지를 볼 수 있다. 앞에 있는 것은 ‘person’이 선택되어 사람 객체가 분할되어 보이며, 뒤에 있는 것은 ‘car’가 선택되어 자동차 객체가 분할되어 보인다. [2]

데이터 셋은 이미지 원본파일과 이를 설명하는 annotation 파일로 구성된다. annotation 파일은 captions, instances, person_keypoints 파일로 구성되며,json 형태로 되어 있다. 각 json 파일은 전체 이미지에 대해 하나로 구성되어 있어 크기 매우 크다.

annotation 에는 개체에 대한 정보가 info, license, images, annotations, categories 등으로 제공된다.

https://www.immersivelimit.com/tutorials/create-coco-annotations-from-scratch

Open Image

Open Image는 구글에서 공개한 오픈 이미지 데이터 셋이다. 이미지 수준 레이블(image-level labels), 객체 경계 상자(object bounding boxes), 객체 분할 마스크(segmentation masks), 시각적 관계(visual relationships), 나레이션(localized narratives)을 포함하는 데이터 이다.

2016년 처음 공개
- Introducing the Open Images Dataset
2018년 V4
- Announcing Open Images V4 and the ECCV 2018 Open Images Challenge
2020년 2월 V6
- Open Images V6 — Now Featuring Localized Narratives

Open Image V4

Open Image V4는 9,178,275개의 이미지에서 30,113,078개의 이미지 수준 레이블과 15,440,132개의 객체 경계 상자를 가지고 있으며, 374,768개의 시각적 관계를 나타내고 있다.

Flickr 에서 고해상도, creative common, crowd sourcing 라이센스 위주로 수집
이미지 분류는 구글 데이터셋 JFT 의 19,794개 분류 체계
Announcing Open Images V4 and the ECCV 2018 Open Images Challenge

Bounding Box

객체 경계 상자는 이미지에서 객체 인식에 활용되기 위한 정보이다.

그림 - google ai blog

바운딩 박스를 통해서 객체 경계 상자에 나타난 객체들은 서로 관계를 맺고 있으며, Open Image에서 이들의 시각적 관계가 아래 같이 같이 점선박스로 보여진다.

그림 - google ai blog: https://ai.googleblog.com/2020/02/open-images-v6-now-featuring-localized.html

Open Image V5

Open Image V5에서는 350개 카테고리의 2,800,000개의 객체 분할 마스크가 추가되었다

Open Image V6

Open Image V6에서는 675,000개의 나레이션이 추가되었다.

Open Images V6 — Now Featuring Localized Narratives

나레이션은 이미지를 설명하는 캡션과 음성 설명이 포함되어 있고 음성 설명과 캡션에 해당하는 사물이나 동작등을 마우스로 그린 트레이스가 포함되어 있다

Visual Genome

Visual Genome은 지식 베이스의 이미지 데이터 셋으로 이미지의 구조를 언어와 연결하려고 노력하고 있다. 108,077개의 이미지에 5,400,000개의 지역 설명과 3,800,000 개의 객체, 2,800,000개의 속성, 2,300,000개의 관계로 구성되어 있다.

데이터 셋은 지역 설명(region descriptions), 객체(Objects), 속성(attributes), 관계(relationships), 지역 그래프(region graphs), 장면 그래프 (Scenegraphs) 및 질문답변으로 구성되어 있다

그림 - https://paperswithcode.com/paper/visual-genome-connecting-language-and-vision/

지역 설명은 객체의 상태나 동작을 나타내고 있으며, 이들은 객체와 속성으로 나누어 설명되며, 각각 그래프의 형태로 간단하게 표현될 수 있다. 이미지의 여러 지역(region)은 합쳐져서 전체 장면 설명을 하는 장면 그래프로 표현된다.

의미론적 분할(Semantic Segmentation)

이미지 분류와 객체 검출과도 연관이 깊은분야로, Cityscapes[3], ADE20K[4], PASCAL VOC2012[5] 등이 있다

Cityscapes는 도시 환경에서의 의미론적 분할을 ADE20K는 sky, road, grass, person,car, bed 등 150종목에 대한 장면 중심의 영상 분할을 다룬다.
PASCAL Context는 PASCALVOC 2010의 확장판으로 400종 이상의 레이블을 제공한다.

거리 추정

이미지와 영상에서 빼놓을 수 없는 분야 중 하나로 실외 거리 추정을 위해서는 KITTI 데이터셋[6]이 실내는 NYU v2[7] 데이터셋이 널리 활용되어 왔다

이미지 생성 분야

2세대 AI는 데이터가 충분할수록 성능 향상을 기대할 수 있는 학습 기반 인공지능으로 이미지 생성 분야는 이러한 데이터를 “생성” 하는 데 활용을 기대할 수 있기 때문에 데이터 관점에서 2세대 AI에서의 이룬 괄목할 만한 성과 중 하나라 할 수 있다.

널리 알려진 이미지 생성 데이터셋으로는

CelebA

10,177명의 유명인사에 대한 202,599 얼굴이미지로 이루어졌다.
FFHQ

연령, 인종, 다양한 배경 변화를 가진 70,000 고해상도 영상들로 이루어졌다.

III. 데이터 부족에 대한 논의

기존에 AI 연구는 빅데이터를 가정하고 있으나 실제 데이터 분석 사례에서는 빅데이터가 아닌 경우가 많다.데이터가 적고 레이블에 일관성이 없는 경우에는 모델을 아무리 개선을 한다고 해도(즉, model-centric 접근 방식을 적용) 성능을 개선하기 어렵다는 것을 2021년 3월 25일 Deep Learning AI에서 주최한 앤드류 응 교수가 보여주었다.

대응

이러한 문제를 해결하기 위해 컴퓨터 비전 분야의 저명한 학회인 CVPR(Computer Vision and Pattern Recognition) 학회에서는 2020년부터 2022년에 걸쳐 limited labeled data와 관련된 워크샵을 다루었으며,
합성 데이터를 만들어 데이터 부족 문제를 극복하려는 많은 시도가 있었다. BMW와 같은 자동차 제조업체뿐만 아니라, 은행, 공장, 병원, 로봇 등 다양한 분야에서 이러한 합성 데이터를 기반으로 AI 모델 학습에 적용하고 있다

가트너, 미래는 합성데이터

2021년 6월 보고서에 따르면 2030년에는 AI의 대부분의 데이터가 합성 데이터를 기반으로 생성될 것으로 보고, 2024년까지 AI 및 분석에 사용되는 데이터의 60%가 이 합성데이터를 사용할 것이라고 예측

실제 데이터를 얻는 비용이 인건비 수준에서 많게는 수십억에 이르는 문제가 있기 때문이다. 반면에, 합성 데이터를 만들어 더욱 정확한 레이블을 얻을 수 있는 경우도 많다.

예를 들어, 거리 추정 데이터의 경우 센서의 정확도가 한계가 있어 픽셀에 매핑되는 거리 레이블의 정확도가 떨어진다. 반면, 합성 데이터의 경우에는 모든 픽셀에서 높은 정확도의 거리 레이블링 데이터를 얻을 수 있다. 즉, 합성데이터는 앞서 언급한 앤드류 응 교수가 지적한 레이블의 품질 저하 문제를 일으키지 않기 때문에 더 정확한 모델 학습이 가능할 수 있다.

합성데이터

합성 데이터를 얻는 방법에는 시뮬레이션으로 얻는 방법, AI 기법(GAN, VAE, Normalizing Flow) 또는 도메인 랜덤화 등이 널리 알려져 있다. 최근에는 확산 모델(Diffusion model)[15]과 NeRF[16]의 등장으로 한층 더 정교해졌다

대표적인 확산 모델로

오픈 AI의 DALL-E 2의 백본 모델이 있다.
확산 오토인코더(Diffusion Autoencoder)와 같이 의미론적 의미가 있는 확산 모델도 제안
NeRF는 기존의 방법들이 시점에 대한 변화를 주기 어려웠던 점에 반해, 차량 앞면을 보고, 뒷면을 생성할 수 있는 등 다양한 시점에서의 영상을 생성할 수 있다. 더 나아가, 2D 이미지에서 3D 이미지를 생성함으로써 영상의 스케일 변화까지 줄 수 있어 데이터 합성에 있어 큰 전환점을 마련하였다

DALL-E 2 backbone Model

이미지와 텍스트의 관계를 학습하고, 이를 통해, 영상에 다양한 변화를 줄 수 있게 했을 뿐만 아니라 텍스트를 통해 고해상도의 이미지를 생성

부족한 데이터 문제를 극복하기 위한 방법으로 자기지도학습(self-supervised learning) 방법

자기지도학습 방법은 비지도학습과 유사하게 레이블 없는 데이터셋에서 사용자가 직접 정의한 작업(pretext task)를 목표로 학습시키게 된다. 이 때, 이 작업은 데이터에서 레이블로 사용될 수 있는 정보를 활용하여 지도학습처럼 학습시키게 되어 데이터 부족 문제를 우회적으로 풀 수 있게 된다.

IV. AI 3세대를 지향하는 디딤돌 데이터셋의 등장

자기주도학습 데이터세트

하나의 태스크에 국한되어 있지 않은 응용성을 가진 데이터셋이 점점 더 다양하게 등장하고 있다. 이러한 현상은 영상 내에서만 국한되지 않고, 텍스트를 포함하고 더 나아가 구조화된 데이터, 3D 신호 데이터 등 점점 더 다양한 데이터셋을 포함하는 방향으로 확장되고 있다. 이렇게 이기종의 빅데이터를 학습시키게 되면 파운데이션 모델(foundation model)을 얻을 수 있게 된다. 이러한 파운데이션 모델은 대규모 데이터로 사전학습되어 다른 모델에 지식을 전달해 줄 수 있는 모델을 의미한다

자기주도학습이 비지도학습과 달리 지도학습에 견줄 수 있는 성능을 획득하게 된 것은 Pretext task 단계에서 큰 데이터셋을 활용할 수 있는 덕분이다.

KITTI 데이터셋

KITTI 데이터셋은 거리 추정을 포함한 2D/3D 객체 검출, 도로 환경에서의 의미론적 분할 정보, 주행거리계(odometry), 도로 환경에서 객체 추적, 차선 검출 등 다양한 정보를 포함하고 있다.KITTI 데이터셋이 자율주행을 위해 필요로 하는 데이터셋을 포함하고 있어 자율주행 기술 발전에 공헌한 바가 크기때문이다

주요 블로그 글

파운데이션 모델:

파운데이션 모델은 스탠포드의 인간중심 인공지능연구소에서 2021년 처음으로 대중화한 용어로 소개되었다. 그러나 파운데이션 모델의 가능성은 먼저 초거대 AI로 불리는 모델
들인 BERT, DALL-E 2, GPT-3로부터 시작되었다.

초거대 AI는 초기에는 언어모델에 국한되었으나, 점차 이미지를 함께 포함하는 모델로, 또는 다양한 언어를 포함하는 모델로 확장되고 있다

초거대 AI

초거대 AI는 초기에는 언어 모델에 국한되었으나, 점차 이미지를 함께 포함하는 모델로, 또는 다양한 언어를 포함하는 모델로 확장되고 있다([표 4] 참조)

최근 발표된 GODEL은 주제를 변경하고 학습시에 주어지지 않은 이벤트에 대한 질문에 응답할 수도 있고, 구조화되지 않은 텍스트를 통해 검색할 수 있게 하며, 대화식 질문에도 응답이 가능한 모델로 인공지능 3세대의 자격요건에 한층 더 가까워졌다.

GODEL(Grounded Open Dialogue Model)

가상비서나 챗봇과 같은 대화 에이전트가 레스토랑 추천과 같은 주제별 전문 지식을 제공하는 것 외에도 지역의 역사나 최근 스포츠 경기에 대한 대화에 참여할 수 있다면 어떨까? 또한 에이전트의 응답이 최근의 이벤트와 이슈를 지속적으로 반영한다면 어떨까?

고델은 마이크로소프트가 2019년에 발표한 최초의 대규모 사전 훈련 언어 모델인 DialoGPT의 개선된 대화형 언어 모델이다. 고델은 응답할 수 있는 쿼리 유형과 가져올 수 있는 정보 소스에 제한이 없는 대화 에이전트를 만드는 것을 목적으로 한다.

마이크로소프트에 따르면 고델은 대화 에이전트에 대화 내용 뿐만 아니라 훈련에 사용된 데이터에 포함되지 않은 외부 정보를 기반으로 응답을 생성할 수 있는 기능을 제공한다.

지역의 레스토랑에 대한 추천을 얘기하는 갑자기 최근에 발생한 토네이도에 대한 얘기를 했을때 웹에서 관련 정보를 가져와 응답하고 원래 주제로 돌아 가려고 하는 내용을 보여준다.

그림 - https://www.microsoft.com/en-us/research/blog/godel-combining-goal-oriented-dialog-with-real-world-conversations/

대용량 데이터 세트의 구축이 초거대 AI 개발 근간

초거대 AI의 개발은 근간이 되는 대용량 데이터셋이 구축된 덕분이다.

구글의 경우 18억 건의 데이터셋을 구축했고
오픈 AI의 경우 10억 건 수준으로 알려져 있다[25].
카카오 브레인은 정제를 거친 20억 건 수준의 이미지ㆍ테스트 데이터를 구축하고 있다[26].

영상을 중심으로 하는 파운데이션 모델은 비전-언어 사전학습 모델(Vision-Language Pretraining:VLP)의 형태로 CLIP, Florence, CoCa 등이 알려져 있다. Open AI의 CLIP은 이미지와 자연어 4억 개 쌍의 관계를 학습한 것이다.

마이크로소프트의 Florence 모델은 30억 개의 이미지-텍스트 쌍의 데이터에 이 중 필터링을 통해 9억 쌍을 얻은 FLOD-9M 데이터셋을 구축하여 학습한 모델이다.

구글의 CoCa는 다양한 벤치마크에서 우수한 성능을 보였을 뿐만 아니라 ImageNet에서의 Zero-shot 성능이 86.3%로 매우 우수한 성능을 얻었다. Zero-shot에서의 우수한 성능은 다양한 하위 과제에서 높은 성능을 얻을 가능성을 보여준다. 즉, 영상만의 대용량보다는 언어 데이터와 쌍을 이루어 학습함으로써 더욱 좋은 표현력을 얻을 수 있게 되었다.

양질의 충분한 데이터 문제

인공지능 모델은 양질의 데이터만 충분하다면 문제
를 해결할 수 있다는 생각이 널리 퍼져 있다. 한편, 양질의 데이터는 비용 문제, 레이블링의
품질 문제, 보안 등으로 충분한 확보가 어려움도 널리 공감을 받고 있다. 합성 데이터 알고리
즘들의 발전과 파운데이션 모델에 기반하여 적응(adaptation)에 필요한 적은 데이터만 확보
하면 되도록 하는 기술의 발전으로 제3세대 인공지능은 스스로 문제에 대한 데이터를 확보 할 수 있는 AI로 한 걸음씩 다가가고 있다

[1]: 인공지능 학습용 영상 데이터 기술 동향, IITP 주간기술동향 1988호, 임철홍

[2]: 영상 분야에서의 인공지능 발달 단계에 따른 데이터와 모델의 변화, IITP 주간기술동향 2071호, 김혜진_한국전자통신연구원 책임연구원

2021-02-01 게시 됨2023-01-12 업데이트 됨AI13분안에 읽기 (약 1985 단어)

Tensorflow 2 : Build on macOS

2021년, macOS에서 최신 tensorflow 를 사용해 보려고 빌드과정을 거쳐 보았다.

macOS: build tesorflow

준비

python

brew 등으로 최신 파이썬 설치
여기서는 가상환경에서 설치한다 가정
- pyenv, venv, conda …
가상환경이 아닌 시스템 환경이면 --user 이용.

유틸 설치

numpy, wheel, keras_preprocessing 설치

가상환경이 아닌 시스템 환경이면 --user 이용.

tensorflow 2.4.1 requires numpy~=1.19.2, but you have numpy 1.18.0 which is incompatible.

1 2	pip install -U pip numpy wheel pip install -U keras_preprocessing --no-deps

설치된 패키지를 확인

1
2
3

$ pip freeze
Keras-Preprocessing==1.1.2
numpy==1.20.0

Xcode

xcode-select –install

Xcode installed on your macOS，Then execute the command：

1	sudo xcodebuild -license accept

What flags are supported by my CPU?

To check the instruction sets supported by your CPU, check the output of the following commands:

macOS

1	$ sysctl -a \| grep "machdep.cpu.*features:"

Linux

1	$ cat /proc/cpuinfo \| grep flags

Bazel 설치

tensorflow/configure.py 파일에서 BAZEL 버전을 찾는다. 이중 MAX 로 지시한 Bazel 버전을 사용한다.

1
2
3

_TF_CURRENT_BAZEL_VERSION = None
_TF_MIN_BAZEL_VERSION = '3.1.0'
_TF_MAX_BAZEL_VERSION = '3.99.0'

https://docs.bazel.build/versions/4.0.0/install-os-x.html 를 참고해서

https://github.com/bazelbuild/bazel/releases 에서 MIN, MaX 사이의 적합한 installer 버전을 설치한다.

다운로드

다운로드한다. 예를 들어 3.7.2 버전의 sh 설치 파일은 bazel-3.7.2-installer-darwin-x86_64.sh 이다.

1 2	$ export BAZEL_VERSION=3.7.2 $ curl -fLO "https://github.com/bazelbuild/bazel/releases/download/${BAZEL_VERSION}/bazel-${BAZEL_VERSION}-installer-darwin-x86_64.sh"

Run the installer

Run the Bazel installer as follows:

1 2	chmod +x "bazel-${BAZEL_VERSION}-installer-darwin-x86_64.sh" ./bazel-${BAZEL_VERSION}-installer-darwin-x86_64.sh --user

--user 플래그로 설치시 환경변수에 지정

1	export PATH="$PATH:$HOME/bin"

1 2	~$ bazel --version bazel 3.7.2

bazel 설치: brew

~$ brew install bazel

빌드

텐서플로우 소스를 준비해서 bazel 을 사용해 빌드한다.

소스 준비

$ git clone https://github.com/tensorflow/tensorflow.git
'tensorflow_src'에 복제합니다...
remote: Enumerating objects: 1081830, done.
remote: Total 1081830 (delta 0), reused 0 (delta 0), pack-reused 1081830
오브젝트를 받는 중: 100% (1081830/1081830), 648.00 MiB | 5.20 MiB/s, 완료.
델타를 알아내는 중: 100% (881614/881614), 완료.
Updating files: 100% (24312/24312), 완료.

v2.3.2 빌드

git 체크아웃

$ git tag
0.12.0-rc0
...
v2.3.0
v2.3.1
v2.3.2


$ git checkout v2.3.2

필요한 유틸리티 패키지 설치

$ python -V
Python 3.8.7


$ pip install -U pip wheel
$ conda install "numpy>=1.8,<1.19"

$ pip install -U keras_preprocessing --no-deps

configure

configure 쉘 스크립이 LFCR 로 되어 ㅇㅣㅆ어서 CR로 변경해야 한다.

1 2	$ mv configure configure.orig $ sed $'s/\r$//' configure.orig > configure

configure

$ ./configure
You have bazel 3.7.2 installed.
Please specify the location of python. [Default is /Users/qkboo/.pyenv/versions/tf2_build/bin/python3]:


Found possible Python library paths:
  /Users/qkboo/.pyenv/versions/tf2_build/lib/python3.8/site-packages
Please input the desired Python library path to use.  Default is [/Users/qkboo/.pyenv/versions/tf2_build/lib/python3.8/site-packages]

Do you wish to build TensorFlow with OpenCL SYCL support? [y/N]: n
No OpenCL SYCL support will be enabled for TensorFlow.

Do you wish to build TensorFlow with ROCm support? [y/N]: n
No ROCm support will be enabled for TensorFlow.

Do you wish to build TensorFlow with CUDA support? [y/N]: n
No CUDA support will be enabled for TensorFlow.

Do you wish to download a fresh release of clang? (Experimental) [y/N]: n
Clang will not be downloaded.

Please specify optimization flags to use during compilation when bazel option "--config=opt" is specified [Default is -march=native -Wno-sign-compare]:


Would you like to interactively configure ./WORKSPACE for Android builds? [y/N]: n
Not configuring the WORKSPACE for Android builds.

Do you wish to build TensorFlow with iOS support? [y/N]: y
iOS support will be enabled for TensorFlow.

Preconfigured Bazel build configs. You can use any of the below by adding "--config=<>" to your build command. See .bazelrc for more details.
	--config=mkl         	# Build with MKL support.
	--config=monolithic  	# Config for mostly static monolithic build.
	--config=ngraph      	# Build with Intel nGraph support.
	--config=numa        	# Build with NUMA support.
	--config=dynamic_kernels	# (Experimental) Build kernels into separate shared objects.
	--config=v2          	# Build TensorFlow 2.x instead of 1.x.
Preconfigured Bazel build configs to DISABLE default on features:
	--config=noaws       	# Disable AWS S3 filesystem support.
	--config=nogcp       	# Disable GCP support.
	--config=nohdfs      	# Disable HDFS support.
	--config=nonccl      	# Disable NVIDIA NCCL support.
Configuration finished

빌드 시작

Intel 기반의 macOS에서 기본 배포되는 tensorflow@2.0 을 설치하고 tensorflow 를 실행하면,

(tf2_p37)~$ python
Python 3.7.9 (default, Aug 31 2020, 07:22:35)
[Clang 10.0.0 ] :: Anaconda, Inc. on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import tensorflow as tf
>>>
>>> tf.add(1,2).numpy()
2021-02-01 14:11:37.000601: I tensorflow/core/platform/cpu_feature_guard.cc:145] This TensorFlow binary is optimized with Intel(R) MKL-DNN to use the following CPU instructions in performance critical operations:  SSE4.1 SSE4.2 AVX AVX2 FMA
To enable them in non-MKL-DNN operations, rebuild TensorFlow with the appropriate compiler flags.
2021-02-01 14:11:37.001166: I tensorflow/core/common_runtime/process_util.cc:115] Creating new thread pool with default inter op setting: 8. Tune using inter_op_parallelism_threads for best performance.
3

특화 명령 을 –copt 부분에 명시해서 빌드한다.

bazel build: Intel CPU 특화 명령 세트

빌드할 때 아래와 같이 cpu option을 추가로주면 해당 cpu에 대해 최적화된 빌드로 진행됩니다. 아래의 copt 들은 머신마다 다르며, tensorflow warning을 보고 적절히 추가해주면 됩니다.

1	$ bazel build -c opt --copt=-mavx --copt=-mavx2 --copt=-mfma --copt=-msse4.2 //tensorflow/tools/pip_package:build_pip_package

pip에 배포된 패키지와 동일하게 진행할 것이라면…

1	bazel build –config=opt //tensorflow/tools/pip_package:build_pip_package

GPU로 Tensorflow를 사용하고 싶다면… (위에 반드시 CUDA 옵션 선택 메시지에서 Y를 눌러야합니다. 그리고 아래와 같은 명령어를 입력하세요.)

1	$ bazel build –config=opt –config=cuda //tensorflow/tools/pip_package:build_pip_package

GPU cuda 를 포함한 빌드와 CpU 특화 를 함께

1	$ bazel build -c opt --copt=-mavx --copt=-mavx2 --copt=-mfma --copt=-mfpmath=both --copt=-msse4.2 --config=cuda //tensorflow/tools/pip_package:build_pip_package

패키지 빌드

pip 패키지를 생성하기 .whl 설치 패키지를 생성한다.
패키지 추출

1	./bazel-bin/tensorflow/tools/pip_package/build_pip_package ../tensorflow_pkg

v2.4.1 빌드

$ git tag
0.12.0-rc0
...
v2.4.0
v2.4.0-rc0
v2.4.0-rc1
v2.4.0-rc2
v2.4.0-rc3
v2.4.0-rc4
v2.4.1

1	git checkout v2.4.1

configure 로 CPU 기반 지원을 구성한다.

$ ./configure
You have bazel 3.7.2 installed.
Please specify the location of python. [Default is /Users/qkboo/.pyenv/versions/miniconda3-latest/bin/python3]: /Users/qkboo/.pyenv/versions/tf2_p38/bin/python


Found possible Python library paths:
  /Users/qkboo/.pyenv/versions/tf2_p38/lib/python3.8/site-packages
Please input the desired Python library path to use.  Default is [/Users/qkboo/.pyenv/versions/tf2_p38/lib/python3.8/site-packages]

Do you wish to build TensorFlow with ROCm support? [y/N]: n
No ROCm support will be enabled for TensorFlow.

Do you wish to build TensorFlow with CUDA support? [y/N]: n
No CUDA support will be enabled for TensorFlow.

Do you wish to download a fresh release of clang? (Experimental) [y/N]: n
Clang will not be downloaded.

Please specify optimization flags to use during compilation when bazel option "--config=opt" is specified [Default is -Wno-sign-compare]:


Would you like to interactively configure ./WORKSPACE for Android builds? [y/N]: n
Not configuring the WORKSPACE for Android builds.

Do you wish to build TensorFlow with iOS support? [y/N]: y
iOS support will be enabled for TensorFlow.

Preconfigured Bazel build configs. You can use any of the below by adding "--config=<>" to your build command. See .bazelrc for more details.
	--config=mkl         	# Build with MKL support.
	--config=mkl_aarch64 	# Build with oneDNN support for Aarch64.
	--config=monolithic  	# Config for mostly static monolithic build.
	--config=ngraph      	# Build with Intel nGraph support.
	--config=numa        	# Build with NUMA support.
	--config=dynamic_kernels	# (Experimental) Build kernels into separate shared objects.
	--config=v2          	# Build TensorFlow 2.x instead of 1.x.
Preconfigured Bazel build configs to DISABLE default on features:
	--config=noaws       	# Disable AWS S3 filesystem support.
	--config=nogcp       	# Disable GCP support.
	--config=nohdfs      	# Disable HDFS support.
	--config=nonccl      	# Disable NVIDIA NCCL support.
Configuration finished

파이썬 실행 가능을 확인하고 configure 후 빌드한다.

$ bazel build --config=opt //tensorflow/tools/pip_package:build_pip_package
...
...

INFO: Build options --action_env and --python_path have changed, discarding analysis cache.
INFO: Analyzed target //tensorflow/tools/pip_package:build_pip_package (406 packages loaded, 31116 targets configured).
INFO: Found 1 target...
Target //tensorflow/tools/pip_package:build_pip_package up-to-date:
  bazel-bin/tensorflow/tools/pip_package/build_pip_package
INFO: Elapsed time: 16525.185s, Critical Path: 542.13s
INFO: 18390 processes: 150 internal, 18240 local.
INFO: Build completed successfully, 18390 total actions

macbook pro 15(2015), 8GB 에서 약 5시간 소요.

패키지 빌드

pip 패키지를 생성하기 .whl 설치 패키지를 생성한다.

./bazel-bin/tensorflow/tools/pip_package/build_pip_package ../tensorflow_pkg

$ $ ls -l ../tensorflow_pkg/
-rw-r--r--   1 qkboo  admin   167M  2  1 13:54 tensorflow-2.4.1-cp38-cp38-macosx_11_0_x86_64.whl

패키지 설치

그리고 현재 파이썬 환경에 텐서 플로우를 설치한다

$ pip install ../tensorflow_pkg/tensorflow-2.4.1-cp38-cp38-macosx_11_0_x86_64.whl

...

Successfully installed absl-py-0.11.0 astunparse-1.6.3 cachetools-4.2.1 certifi-2020.12.5 chardet-4.0.0 flatbuffers-1.12 gast-0.3.3 google-auth-1.24.0 google-auth-oauthlib-0.4.2 google-pasta-0.2.0 grpcio-1.32.0 h5py-2.10.0 idna-2.10 markdown-3.3.3 numpy-1.19.5 oauthlib-3.1.0 opt-einsum-3.3.0 protobuf-3.14.0 pyasn1-0.4.8 pyasn1-modules-0.2.8 requests-2.25.1 requests-oauthlib-1.3.0 rsa-4.7 six-1.15.0 tensorboard-2.4.1 tensorboard-plugin-wit-1.8.0 tensorflow-2.4.1 tensorflow-estimator-2.4.0 termcolor-1.1.0 typing-extensions-3.7.4.3 urllib3-1.26.3 werkzeug-1.0.1 wrapt-1.12.1

빌드 후에 소스 트리 디렉토리에서 벗어나 설치된 텐서 플로우를 확인해 보자.

$ cd ~
$ python

>>> import tensorflow as tf



>>> import tensorflow as tf
>>> tf.add(1, 2).numpy()
3
>>> hello = tf.constant('Hello, TensorFlow!')
>>> hello.numpy()
b'Hello, TensorFlow!'



>>> t = tf.constant('logcg')
2020-01-18 20:04:43.088104: I tensorflow/compiler/xla/service/service.cc:168] XLA service 0x7fefdc983db0 initialized for platform Host (this does not guarantee that XLA will be used). Devices:
2020-01-18 20:04:43.088134: I tensorflow/compiler/xla/service/service.cc:176]   StreamExecutor device (0): Host, Default Version

2017-07-12 게시 됨2022-02-26 업데이트 됨AI11분안에 읽기 (약 1596 단어)

AI / Start Google TensorFlow

Getting Started with TensorFlow 글을 요약 번역한다.

tensorflow를 사용하기 위해서는

Python 프로그래밍
배열에 대한 이해
머신러닝에 대한 이해.

TensorFlow는 여러 API를 제공하고 있다.

TensorFlow Core: 가장 저수준 API
고수준 API는 TensorFlow Core 위에 구성되 있다.

고수준 API 에서 contrib- 를 포함한 메서드 이름은 개발중으로 향후 변경 가능성이 크다.

LLM 활용

LLM의 주요 활용 분야

1. 콘텐츠 생성 및 요약

2. 고객 서비스 및 상호작용

3. 교육 및 학습

4. 코드 생성 및 개발

5. 데이터 분석 및 인사이트 도출

장점

한계

LLM 응용 전략

1. Fineturning

작동 방식:

전이학습

파인 튜닝의 어려움

활용 예:

2. RAG

작동 방식:

활용예

3. Agent

작동 방식:

4. 퓨샷, 제로샷 러닝

제로샷 러닝

기존 모델에 전혀 보지 못한 데이터가 제시되었을 때 예측을 수행할 수 있는 것을 제로샷 러닝이라고 한다. - 기존 모델이 방대한 데이터를 바탕으로 추상화하고 일반화할 수 있는 능력이 필요

원샷 러닝

퓨샷 러닝

— 참고 —

언어모델(LM, Language Model)

BERT

Transformer 아키텍처

Self-attention

Parallelize

사전학습

부호제거

양방향 언어모델

self-attention

Deepseek V3

Deepseek Timeline

특징

LLM 기법 해설

전통 Attention 매커니즘

전통적 Attention 매커니즘 작동방식

다양한 Attention 매커니즘

전통 Attention 한계

Offload

— 참고 —

llama-3-Korean-Bllossom-8B-Q4_K_M.gguf

lemon-mint/LLaMa-3.1-Korean-Reasoning-8B-Instruct-Q8

UNIVA-Deepseek-llama3.1-Bllossom-8B

6Bit

8bit

DeepSeek-R1-Distill-Llama-8B-Q8_0.gguf

DeepSeek-R1-Distill-Llama-8B_korean_reasoning

6bit

8bit

RTX3080ti 에서

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf

DeepSeek-R1-Distill-Qwen-32B-Q2_K.gguf

정리

DeepSeek-R1-Distill-Llama-8B-F16.gguf

누구?

데이터

창조능력

끝말잇기

문제 만들기1

문제만들기2

판단

문장 교정

영문 번역

명령 에러 처리

지명과 특산물

강수량과 그 영향

라니냐 발생 가능성

경제 이론

크롤링

외부 파일 처리 여부

마무리

Qwen2.5-32B

누구?

기존 모델에 전혀 보지 못한 데이터가 제시되었을 때 예측을 수행할 수 있는 것을 제로샷 러닝이라고 한다.
- 기존 모델이 방대한 데이터를 바탕으로 추상화하고 일반화할 수 있는 능력이 필요