인공지능 콘텐츠 생성 심층 복호화 개발 및 현상 유지
요약
AIGC는 Web3.0 시대의 생산성 도구로 AIGC는 많은 양의 생산성을 제공하며 Web3.0과 블록체인의 적용이 생산 관계와 사용자 주권을 결정합니다.
요약
AIGC는 Web3.0 시대의 생산성 도구로 AIGC는 많은 양의 생산성을 제공하며 Web3.0과 블록체인의 적용이 생산 관계와 사용자 주권을 결정합니다.
그러나 우리는 AIGC와 Web3가 서로 다른 방향이라는 것을 깨달아야 합니다. AI 기술을 이용한 제작 도구로서 AIGC는 Web2 세계와 Web3 세계 모두에 적용될 수 있습니다. 지금까지 개발된 대부분의 프로젝트는 여전히 Web2 영역에 있습니다. 두 사람을 함께 이야기하는 것은 부적절합니다. 그리고 Web3는 블록체인과 스마트 계약 기술을 사용하여 사용자가 가상 자산의 주권을 가질 수 있기를 희망합니다. 그것과 생성 모드 사이에는 직접적인 연결이 없습니다.
이 기사는 다음 네 가지 측면에서 AIGC의 개발 및 현재 상황을 해독합니다.
콘텐츠 제작 양식의 진화
기술 테스트 개요
AIGC의 산업 응용
AIGC 및 Web3
1부: 콘텐츠 제작 양식의 진화
세 단계로 나눌 수 있습니다.
1단계는 PGC(Professionally-Generated Content)로 전문가가 콘텐츠를 제작하고 콘텐츠 관련 분야의 자격을 갖춘 전문팀이 콘텐츠를 제작하는 단계로 문턱과 비용이 높고 품질이 어느 정도 보장되는 단계이다. TV 드라마, 영화 등 상업 채널의 장점을 추구하며 대표적인 사업이 아유텡이 주도하는 영상플랫폼이다. 이러한 플랫폼에서 사용자는 주로 Web1.0의 개념과 유사하게 시청할 비디오 리소스를 수신하고 검색합니다.
하지만 현 단계에서 창작권은 소수의 전문가에게 넘어가고 일반 창작자의 성과는 대중에게 보이기 어렵다. 2단계에서는 트위터, 유튜브, 아유텡과 같은 국내 동영상 플랫폼 등 일련의 UGC 플랫폼(User-Generated Content, User-Generated Content)이 파생되었다. 이러한 플랫폼에서 사용자는 수신자일 뿐만 아니라 콘텐츠 제공자이기도 합니다. .


그렇다면 Web3.0 시대의 콘텐츠 제작 생태계는 무엇일까요? AIGC와 web3 사이의 연결은 어디에 있습니까?
AIGC(AI 생성 콘텐츠, 인공 지능 생성 콘텐츠)는 인공 지능이 콘텐츠 생성에서 인간을 돕거나 심지어 대체하여 Web3.0 및 Metaverse에서 일부 실용적인 문제를 해결하는 데 도움이 되는 강력한 생산성 도구로 사용할 수 있음을 의미합니다. 더 자주 생산되며 모든 사람의 요구에 맞게 스타일을 지정할 수 있습니다. 콘텐츠 제작 영감을 위한 무제한 규모이며 그 결과도 나쁘지 않습니다.

파트 II: 기술 테스트 개요
AIGC 기술의 급속한 발전은 GAN(Generation Against Network, 2014) 모델의 발표와 함께 시작되었습니다. 생성 모델과 판별 모델의 두 가지 모델로 구성됩니다. 생성기는 "가짜" 데이터를 생성하고 판별자를 속이려고 시도합니다. 판별자는 생성된 데이터를 확인하고 모든 "가짜" 데이터를 올바르게 식별하려고 시도합니다. 교육 반복 중에 두 네트워크는 평형 상태에 도달할 때까지 서로 개선됩니다.
AIGC 기술의 급속한 발전은 GAN(Generation Against Network, 2014) 모델의 발표와 함께 시작되었습니다. 생성 모델과 판별 모델의 두 가지 모델로 구성됩니다. 생성기는 "가짜" 데이터를 생성하고 판별자를 속이려고 시도합니다. 판별자는 생성된 데이터를 확인하고 모든 "가짜" 데이터를 올바르게 식별하려고 시도합니다. 교육 반복 중에 두 네트워크는 평형 상태에 도달할 때까지 서로 개선됩니다.
GAN이 발표된 후 2~3년 동안 업계에서는 GAN 모델의 다양한 변형과 응용이 이루어졌습니다. 2016년과 2017년에는 음성 합성, 감정 감지, 얼굴 변경 등의 분야에서 많은 실용적인 응용 프로그램이 생성되었습니다.

2017년 Google에서 개발한 Transformer 모델은 LSTM(Long and Short Term Memory)과 같은 전통적인 RNN 모델을 점진적으로 대체했으며 NLP 문제에 대한 선택 모델이 되었습니다.
Se q2 seq 모델로서 당면한 작업에 가장 중요한 정보를 결정하기 위해 각 단어와 컨텍스트의 상관 관계를 계산하는 어텐션 메커니즘을 제안합니다. Transformer는 다른 모델보다 더 빠르고 유효한 정보를 더 오래 유지합니다.
BERT(Bidirectional Encoder Representations from Transformer, 2018)는 Transformer를 사용하여 자연어 처리를 위한 완전한 모델 프레임워크를 구축합니다. 다양한 자연어 처리 작업에서 기존 모델을 능가합니다.

BERT(Bidirectional Encoder Representations from Transformer, 2018)는 Transformer를 사용하여 자연어 처리를 위한 완전한 모델 프레임워크를 구축합니다. 다양한 자연어 처리 작업에서 기존 모델을 능가합니다.
그 이후로 모델의 크기는 계속해서 증가했고 최근 2년 동안 GPT-3, InstructGPT, ChatGPT와 같은 대형 모델이 많이 나왔고 비용도 기하급수적으로 증가했습니다.
오늘날의 언어 모델에는 대형 모델, 대형 데이터 및 대형 컴퓨팅 성능이라는 세 가지 특성이 있습니다. 위의 도표에서 모델 매개변수 수가 얼마나 빨리 증가하는지 확인할 수 있습니다. 어떤 사람들은 언어 모델의 무어의 법칙(1년에 10배 증가)을 제안하기도 했습니다. 새로 출시된 ChatGPT 모델은 1,750억 개의 매개변수를 가지고 있으며, 그 이후 GPT-4에 얼마나 많은 매개변수가 있는지 상상하기 어렵습니다.
ChatGPT의 장점:
HFRL(Human Feedback RL, 2022.03) 기술을 도입하여 훈련 데이터 세트에 사람의 피드백을 추가하고 사람의 피드백을 기반으로 최적화하지만 많은 사람의 주석이 필요하기 때문에 비용이 더 확장됩니다.
두 번째 요점은 모델이 질문에 답할 때 자체 원칙을 가질 것이라는 점입니다. 이전의 챗봇은 사용자와 채팅을 할 때 부정적이고 민감한 내용을 학습했고, 마침내 악용과 차별적인 발언을 하는 방법을 배웠습니다. 이전 모델과 달리 ChatGPT는 악성 메시지를 식별한 후 답변을 거부할 수 있습니다.
메모리: ChatGPT는 지속적인 대화를 지원하고 사용자와의 이전 대화 내용을 기억할 수 있으므로 여러 라운드의 대화 후에 사용자는 답변이 지속적으로 개선되고 있음을 알게 될 것입니다.
Link:https://new.qq.com/rain/a/20221121 A 04 ZNE 00
파트 III: AIGC의 산업적 응용
2022 Qiji Chuangtan Autumn Camp에 참가하는 55개 기업 중 AI 테마 기업은 19개 기업, Metaverse 테마 기업은 15개 기업, 대형 모델 테마 기업은 16개 기업이다. AIGC와 관련된 프로젝트가 10개 이상 있으며, 그 중 절반 이상이 이미지 관련 프로젝트입니다. 각 프로젝트에 대한 자세한 내용은 아래 링크에 첨부되어 있습니다.
AIGC의 가장 인기있는 세분 트랙은 이미지 분야입니다.Stable Diffusion의 산업 응용 덕분에 이미지 AIGC는 2022년에 폭발적인 성장을 이끌 것입니다. 특히 이미지 AIGC 트랙은 다음과 같은 이점이 있습니다.
자연어 처리의 대형 모델에 비해 CV 분야의 모델 크기가 상대적으로 작고 Web3에 대한 적합도가 높으며 NFT 및 메타버스와 긴밀하게 연결될 수 있습니다.
사진은 더 흥미롭고 다양하며, 기술의 이 부분은 현재 성숙하고 빠르게 반복되고 있습니다.
확산 모델

2022 Qiji Chuangtan Autumn Camp에 참가하는 55개 기업 중 AI 테마 기업은 19개 기업, Metaverse 테마 기업은 15개 기업, 대형 모델 테마 기업은 16개 기업이다. AIGC와 관련된 프로젝트가 10개 이상 있으며, 그 중 절반 이상이 이미지 관련 프로젝트입니다. 각 프로젝트에 대한 자세한 내용은 아래 링크에 첨부되어 있습니다.
확산 모델
2022년 CVPR 논문 "잠재 확산 모델을 사용한 고해상도 이미지 합성"
이미지에 노이즈를 추가하면 그림이 임의의 노이즈가 있는 그림으로 바뀔 수 있으며 확산 모델은 노이즈를 제거하는 방법을 학습합니다. 그런 다음 모델은 이 노이즈 제거 프로세스를 임의의 노이즈가 있는 사진에 적용하여 사실적인 이미지를 생성합니다.
현재 이미지 AIGC 필드에는 특히 다음과 같은 몇 가지 제한 사항이 있습니다.
모델은 효과와 효율성 사이에서 균형을 이루어야 하며 사용자가 두 번째 수준에서 기대하는 정확하고 맞춤화된 효과를 생성하는 것은 여전히 어렵습니다.
이러한 회사는 운영 및 유지 관리 비용이 높으며 모델을 구동하기 위해 많은 그래픽 카드 장비가 필요합니다.
이 트랙은 최근 경쟁이 치열하지만 킬러 앱이 부족한 수많은 신생 기업을 보았습니다.
다음으로 3D-AIGC에 대해 알아보겠습니다. 잠재력이 큰 트랙입니다. 현재 모델은 아직 성숙하지 않았지만 향후 메타버스에서 꼭 필요한 인프라가 될 것입니다.
2D 이미지 생성과 유사하게 3D-AIGC 프로젝트는 3D 개체를 생성하고 3D 장면을 자동으로 렌더링 및 구축할 수 있습니다. 앞으로 메타버스가 대중화되면 가상 세 자리 자산에 대한 수요가 많을 것이다. 사용자가 3차원 장면에 있을 때 사용자에게 필요한 것은 더 이상 2차원 그림이 아니라 3차원 물체와 장면입니다.

3D로 가상 자산을 생성하려면 2D 이미지를 생성하는 것보다 더 많은 고려 사항이 필요합니다. 3차원 가상 객체는 두 부분으로 구성됩니다. 하나는 3차원 모양이고 다른 하나는 텍스처라고 하는 객체 표면의 패턴과 패턴입니다.
따라서 모델은 3D 가상자산을 선택해야 하며 두 단계로 생성할 수 있습니다. 3D 개체의 형상을 얻은 후에 텍스처 매핑, 환경 매핑 및 기타 방법을 통해 표면 텍스처를 제공할 수 있습니다.
3차원 물체의 기하학적 형태를 기술할 때 그리드, 포인트 클라우드와 같은 명시적 표현뿐만 아니라 대수학 및 NeRF(Neural Radiation Field)와 같은 암시적 표현도 포함하여 다양한 표현을 고려할 필요가 있습니다. 특히 모델을 적응시키는 방법을 선택해야 합니다.
즉, 우리는 궁극적으로 이러한 모든 프로세스를 통합하여 텍스트에서 3D 이미지로의 프로세스 파이프라인을 형성해야 합니다. 파이프라인은 상대적으로 길고 성숙한 애플리케이션 측 모델은 아직 없습니다. 그러나 확산 모델의 인기로 인해 많은 연구자들이 3D 이미지 생성 기술을 더 연구하게 될 것입니다. 현재 이 방향의 기술 모델도 빠르게 반복되고 있습니다.
VR, XR 및 기타 기술과 비교하여 사람들과 상호 작용해야 하고 실시간 성능에 대한 엄격한 요구 사항이 있습니다. 3D AIGC의 실시간 요구 사항은 더 낮고 애플리케이션 임계값과 속도는 더 빨라질 것입니다.
4부: AIGC 및 Web3
AIGC는 web3.0 시대의 생산성 도구라고 하는데 AIGC는 많은 양의 생산성을 제공하는 반면 web3.0과 블록체인의 적용은 생산과 사용자 주권의 관계를 결정짓는다.
그러나 우리는 AIGC와 Web3가 서로 다른 방향이라는 것을 깨달아야 합니다. AI 기술을 이용한 생산 도구로서 AIGC는 web2 세계와 Web3 세계 모두에 적용될 수 있습니다. 지금까지 개발된 대부분의 프로젝트는 여전히 Web2 영역에 있습니다. 두 사람을 함께 이야기하는 것은 부적절합니다. 그리고 Web3는 블록체인과 스마트 계약 기술을 사용하여 사용자가 가상 자산의 주권을 가질 수 있기를 희망합니다. 그것과 생성 모드 사이에는 직접적인 연결이 없습니다.
그러나 둘 사이에는 실제로 많은 유사점이 있습니다.
한편으로 그들은 모두 프로그램에 의존하여 기존 생산 및 저작 모델을 최적화합니다. AIGC는 창작을 위해 인간을 AI로 대체하고 Web3는 인공 중앙 집중식 기관을 스마트 계약 및 블록체인과 같은 분산 프로그램으로 대체합니다. 사람 대신 기계를 사용하면 주관적인 오류와 편차가 제거되고 효율성이 크게 향상됩니다.
반면에 Web3와 Metaverse는 2차원 사진과 오디오, 3차원 가상 개체와 장면에 대한 수요가 많을 것이며 AIGC는 이를 충족하는 좋은 방법입니다.
그러나 web3.0의 개념이 일반 대중에게 대중화되지 않았을 때 떠오르는 프로젝트는 거의 Web2 프로젝트이고 web3 분야의 응용 프로그램은 여전히 이미지 생성을 위해 AIGC에 주로 사용되는 것을 볼 수 있습니다. NFT 생성을 위해.
실제로 응용 프로그램 측면에서 AIGC와 web3.0 간의 연결은 "생산성"과 "생산 관계" 간의 연결에만 의존할 수 없습니다. 왜냐하면 AIGC는 web2 프로젝트에도 생산성 향상을 가져올 수 있기 때문입니다. 명백하지 않다.

따라서 AIGC 개발의 기회를 잡기 위해서는 현재 web3 프로젝트를 다음 두 가지 측면에서 최적화해야 한다고 생각합니다.
하나는 AIGC에서 지원하는 네이티브 Web3.0 프로젝트, 즉 Web3 측에서만 적용할 수 있는 프로젝트를 찾는 것입니다. 즉, AIGC를 사용하여 Web3 프로젝트가 직면한 현재의 딜레마를 해결하는 방법에 대해 생각해 보면 이러한 솔루션도 Web3에 고유합니다. 예를 들어, ReadOn은 AIGC를 사용하여 기사 퀴즈를 생성하고, Proof of Read의 새로운 모델을 열고, ReadFi에 항상 존재했던 브러싱 코인 문제를 해결하고, 실제로 읽은 사용자에게 토큰 보상을 제공합니다. 어렵지만 web3는 그런 모델 혁신이 필요합니다.
두 번째는 AIGC를 사용하여 기존 Web3 애플리케이션의 효율성과 사용자 경험을 최적화하는 것입니다. 현재 AIGC의 적용은 주로 이미지와 NFT에 존재하지만, 실제로 생성은 매우 광범위한 개념이며 사진 외에도 많은 생성 방법이 있습니다. 위에서 언급한 3D-AIGC는 메타버스에서 생각할 수 있는 응용 채널이고, 퀴즈 생성도 현 시점에서 빛나는 아이디어다. eduDAO와 개발자 플랫폼은 AIGC를 사용하여 교육을 강화하고, 질문을 만들거나 모듈 코드를 수정하고, 단일 테스트를 생성하는 등 AIGC를 사용하는 것에 대해 생각할 수 있습니다. 심지어 스마트 계약을 생성하는 AIGC 코딩 기능을 사용합니다.
비디오 링크: https://www.bilibili.com/video/BV17D4y1p7EY/spm_id_from=333.999.0.0

감사해요:
분산형 미디어 및 연구 조직인 DAOrayaki는 THUBADAO가 독립적인 연구를 수행하고 결과를 공개적으로 공유하도록 공적 자금을 지원했습니다. 연구 주제는 주로 Web3, DAO 및 기타 관련 분야에 중점을 둡니다. 이번 글은 펀딩 결과 공유 여섯 번째 글입니다.
DAOrayaki는 완전한 기능을 갖춘 분산형 미디어 플랫폼이자 커뮤니티의 의지를 나타내는 연구 기관입니다. 제작자, 자금 제공자 및 독자를 연결하고 Bounty, Grant 및 예측 시장과 같은 여러 거버넌스 도구를 제공하고 커뮤니티가 다양한 주제에 대해 자유롭게 연구, 큐레이팅 및 보고하도록 장려하는 것을 목표로 합니다.
DAOrayaki & THUBADAO|웹 3.0 시대의 미디어: 온체인 미디어 플랫폼, 온체인 셀프 미디어 및 미디어 DAO


