ทีมวิจัยจาก Zhejiang เสนอเส้นทางใหม่: สอนวิธีที่สมองมนุษย์เข้าใจโลกให้กับ AI

特邀专栏作者

2026-04-05 04:31

บทความนี้มีประมาณ 1742 คำ การอ่านทั้งหมดใช้เวลาประมาณ 3 นาที

มุมมองหลักเชื่อว่ายิ่งโมเดลมีพารามิเตอร์มากขึ้น ก็จะยิ่งใกล้เคียงกับวิธีคิดของมนุษย์มากขึ้น อย่างไรก็ตาม เอกสารวิจัยที่ทีมจาก Zhejiang ตีพิมพ์ใน Nature Communications เมื่อวันที่ 1 เมษายน ได้เสนอแนวคิดที่แตกต่าง พวกเขาพบว่าเมื่อขนาดของโมเดล (ส่วนใหญ่เป็น SimCLR, CLIP, DINOv2) ใหญ่ขึ้น ความสามารถในการจดจำสิ่งเฉพาะเจาะจงจะเพิ่มขึ้นอย่างต่อเนื่องจริง แต่ความสามารถในการเข้าใจแนวคิดเชิงนามธรรมไม่เพียงแต่ไม่เพิ่มขึ้น แต่กลับลดลง

สรุปโดย AI

ขยาย

มุมมองหลัก: การวิจัยของทีมจากมหาวิทยาลัย Zhejiang พบว่าการเพิ่มขึ้นของขนาดพารามิเตอร์โมเดลขนาดใหญ่ช่วยเพิ่มความสามารถในการจดจำแนวคิดเฉพาะเจาะจงเป็นหลัก แต่จะลดทอนความสามารถในการเข้าใจแนวคิดเชิงนามธรรม สิ่งนี้เผยให้เห็นความแตกต่างพื้นฐานระหว่าง AI กับสมองมนุษย์ในวิธีการจัดระเบียบแนวคิด และได้เสนอทิศทางใหม่ในการใช้สัญญาณสมองเพื่อชี้นำการปรับโครงสร้างโมเดลให้เหมาะสม
องค์ประกอบสำคัญ:
1. การวิจัยพบว่าเมื่อพารามิเตอร์โมเดลเพิ่มจาก 22.06 ล้านเป็น 304.37 ล้าน อัตราความแม่นยำของงานแนวคิดเฉพาะเจาะจงเพิ่มจาก 74.94% เป็น 85.87% ในขณะที่อัตราความแม่นยำของงานแนวคิดเชิงนามธรรมลดจาก 54.37% เป็น 52.82%
2. สมองมนุษย์เก่งในการสร้างความสัมพันธ์แนวคิดแบบลำดับชั้นเพื่อถ่ายโอนความรู้ ในขณะที่โมเดลพึ่งพาลักษณะพื้นผิวจากข้อมูลมากกว่า และยากที่จะสร้างการจัดประเภทเชิงนามธรรมระดับสูงอย่างมั่นคง
3. ทีมเสนอให้ใช้สัญญาณสมองของมนุษย์ขณะดูภาพเป็นตัวกำกับดูแล เพื่อถ่ายโอนโครงสร้างองค์กรแนวคิดของสมองมนุษย์ไปยังโครงข่ายประสาทเทียมลึก
4. หลังจากการฝึกด้วยสัญญาณสมอง โมเดลแสดงการปรับปรุงอย่างมีนัยสำคัญในงานจดจำแนวคิดเชิงนามธรรมภายใต้การเรียนรู้จากตัวอย่างน้อยและการสถานการณ์ใหม่ โดยเพิ่มขึ้นเฉลี่ย 20.5% และยังแซงหน้าโมเดลควบคุมที่มีพารามิเตอร์มากกว่า
5. การวิจัยนี้เปลี่ยนจุดสนใจของอุตสาหกรรมจาก "ขนาดที่ใหญ่กว่า" เป็น "โครงสร้างที่ดีกว่า" โดยมีเป้าหมายเพื่อทำให้วิธีคิดของ AI ใกล้เคียงกับสมองมนุษย์มากขึ้น บรรลุความสามารถในการเข้าใจเชิงนามธรรมที่แท้จริงและการถ่ายโอนความรู้

โมเดลใหญ่ยังคงขยายตัวขึ้นเรื่อยๆ โดยมุมมองหลักเชื่อว่ายิ่งโมเดลมีพารามิเตอร์มากเท่าไหร่ ก็จะยิ่งใกล้เคียงกับวิธีคิดของมนุษย์มากขึ้นเท่านั้น อย่างไรก็ตาม งานวิจัยที่เผยแพร่โดยทีมจากมหาวิทยาลัยเจ้อเจียงใน Nature Communications เมื่อวันที่ 1 เมษายน ได้เสนอมุมมองที่แตกต่างออกไป (ลิงก์ต้นฉบับ: https://www.nature.com/articles/s41467-026-71267-5) พวกเขาพบว่าเมื่อขนาดของโมเดล (ส่วนใหญ่เป็น SimCLR, CLIP, DINOv2) ขยายใหญ่ขึ้น ความสามารถในการจดจำสิ่งของเฉพาะเจาะจงจะดีขึ้นอย่างต่อเนื่องจริง แต่ความสามารถในการเข้าใจแนวคิดเชิงนามธรรมไม่เพียงแต่ไม่ดีขึ้น แต่กลับลดลงด้วย เมื่อพารามิเตอร์เพิ่มจาก 22.06 ล้านเป็น 304.37 ล้าน งานที่เกี่ยวกับแนวคิดเฉพาะเจาะจงเพิ่มจาก 74.94% เป็น 85.87% ในขณะที่งานที่เกี่ยวกับแนวคิดเชิงนามธรรมลดจาก 54.37% เป็น 52.82%

ความแตกต่างระหว่างวิธีคิดของมนุษย์และโมเดล

เมื่อสมองมนุษย์ประมวลผลแนวคิด มันจะสร้างระบบความสัมพันธ์ในการจัดหมวดหมู่ขึ้นมาก่อน หงส์และนกเค้าแมวมีรูปร่างหน้าตาไม่เหมือนกัน แต่มนุษย์ก็ยังจัดพวกมันไว้ในหมวดหมู่ 'นก' ขึ้นไปอีกขั้น นกและม้าก็ยังสามารถจัดรวมไว้ในชั้น 'สัตว์' ได้อีก เมื่อมนุษย์เห็นสิ่งใหม่ๆ มักจะคิดก่อนว่ามันเหมือนกับสิ่งที่เคยเห็นมาก่อน ควรจัดอยู่ในหมวดหมู่ไหน มนุษย์เรียนรู้แนวคิดใหม่ๆ อย่างต่อเนื่อง จากนั้นจึงจัดระเบียบประสบการณ์ และใช้ระบบความสัมพันธ์นี้ในการจดจำสิ่งใหม่ๆ และปรับตัวให้เข้ากับสถานการณ์ใหม่

โมเดลก็จัดหมวดหมู่เช่นกัน แต่วิธีการก่อตัวต่างกัน โดยหลักแล้วมันอาศัยรูปแบบที่ปรากฏซ้ำๆ ในข้อมูลปริมาณมาก ยิ่งวัตถุเฉพาะเจาะจงปรากฏบ่อยเท่าไหร่ โมเดลก็ยิ่งจดจำมันได้ง่ายขึ้น แต่เมื่อมาถึงขั้นของหมวดหมู่ที่ใหญ่ขึ้น โมเดลก็ค่อนข้างลำบาก มันต้องจับจุดร่วมระหว่างวัตถุหลายๆ ชิ้น จากนั้นจึงจัดกลุ่มจุดร่วมเหล่านี้ไว้ในหมวดหมู่เดียวกัน โมเดลที่มีอยู่ในปัจจุบันยังมีข้อบกพร่องที่ชัดเจนในจุดนี้ เมื่อพารามิเตอร์เพิ่มขึ้นอย่างต่อเนื่อง งานที่เกี่ยวกับแนวคิดเฉพาะเจาะจงจะดีขึ้น ในขณะที่งานที่เกี่ยวกับแนวคิดเชิงนามธรรมบางครั้งก็ลดลง

จุดร่วมระหว่างสมองมนุษย์และโมเดล คือทั้งคู่ต่างก่อตัวระบบความสัมพันธ์ในการจัดหมวดหมู่ภายใน แต่ทั้งสองฝ่ายมีจุดเน้นที่ต่างกัน พื้นที่การมองเห็นระดับสูงของสมองมนุษย์จะแบ่งหมวดหมู่ใหญ่ๆ เช่น สิ่งมีชีวิตและสิ่งไม่มีชีวิตโดยธรรมชาติ ในขณะที่โมเดลสามารถแยกแยะวัตถุเฉพาะเจาะจงได้ แต่ยากที่จะก่อตัวหมวดหมู่ที่ใหญ่ขึ้นเช่นนี้อย่างมั่นคง ความแตกต่างนี้นำไปสู่การที่สมองมนุษย์สามารถนำประสบการณ์เก่ามาใช้กับวัตถุใหม่ได้ง่ายกว่า ดังนั้นเมื่อเผชิญกับสิ่งที่ไม่เคยเห็นมาก่อน เราจึงสามารถจัดหมวดหมู่ได้อย่างรวดเร็ว ในขณะที่โมเดลพึ่งพาความรู้ที่มีอยู่มากกว่า ดังนั้นเมื่อเจอวัตถุใหม่ จึงมักติดอยู่ที่ลักษณะผิวเผิน วิธีการที่เสนอในงานวิจัยนี้ ก็พัฒนาขึ้นโดยอ้อมรอบลักษณะพิเศษนี้ โดยใช้สัญญาณสมองมาควบคุมโครงสร้างภายในของโมเดล เพื่อให้มันใกล้เคียงกับวิธีการจัดหมวดหมู่ของสมองมนุษย์มากขึ้น

แนวทางแก้ไขของทีมมหาวิทยาลัยเจ้อเจียง

แนวทางแก้ไขที่ทีมเสนอก็มีความพิเศษเช่นกัน ไม่ใช่การเพิ่มพารามิเตอร์ต่อไป แต่เป็นการใช้สัญญาณสมองจำนวนน้อยมาเป็นตัวกำกับดูแล สัญญาณสมองที่นี่ มาจากบันทึกกิจกรรมสมองของมนุษย์ขณะดูภาพ ต้นฉบับงานวิจัยเขียนไว้ว่า การถ่ายโอนโครงสร้างแนวคิดของมนุษย์ (human conceptual structures transfer) ให้กับ DNNs ความหมายก็คือการสอนโมเดลให้มากที่สุด ว่าสมองมนุษย์จัดหมวดหมู่อย่างไร สรุปความอย่างไร และจัดแนวคิดที่ใกล้เคียงกันไว้ด้วยกันอย่างไร

ทีมใช้หมวดหมู่ฝึกฝนที่รู้จัก 150 หมวดหมู่ และหมวดหมู่ทดสอบที่ไม่เคยเห็นมาก่อน 50 หมวดหมู่ ในการทดลอง ผลลัพธ์แสดงให้เห็นว่า ขณะที่การฝึกฝนชุดนี้ดำเนินไป ระยะห่างระหว่างโมเดลกับการแสดงลักษณะของสมองลดลงอย่างต่อเนื่อง การเปลี่ยนแปลงนี้เกิดขึ้นพร้อมกันในทั้งสองหมวดหมู่ ซึ่งบ่งชี้ว่าโมเดลไม่ได้เรียนรู้แค่ตัวอย่างเดี่ยวๆ แต่เริ่มเรียนรู้วิธีการจัดระเบียบแนวคิดที่ใกล้เคียงกับสมองมนุษย์มากขึ้นอย่างแท้จริง

หลังจากผ่านการฝึกฝนชุดนี้แล้ว โมเดลมีความสามารถในการเรียนรู้ที่แข็งแกร่งขึ้นเมื่อมีตัวอย่างน้อย และแสดงผลได้ดีขึ้นเมื่อเผชิญกับสถานการณ์ใหม่ ในงานที่ให้ตัวอย่างน้อยมาก แต่ต้องการให้โมเดลแยกแยะแนวคิดเชิงนามธรรม เช่น สิ่งมีชีวิตและสิ่งไม่มีชีวิต โมเดลมีประสิทธิภาพเพิ่มขึ้นโดยเฉลี่ย 20.5% และยังเกินกว่าโมเดลควบคุมที่มีพารามิเตอร์มากกว่ามากอีกด้วย ทีมยังได้ทำการทดสอบเฉพาะเพิ่มเติมอีก 31 ชุด โดยโมเดลหลายประเภทต่างแสดงการปรับปรุงใกล้เคียงหนึ่งในสิบ

ในช่วงหลายปีที่ผ่านมา เส้นทางที่วงการโมเดลคุ้นเคยคือโมเดลที่มีขนาดใหญ่ขึ้น ทีมมหาวิทยาลัยเจ้อเจียงเลือกทิศทางอื่น นั่นคือการเปลี่ยนจาก 'ใหญ่กว่าดีกว่า' (bigger is better) สู่ 'มีโครงสร้างยิ่งฉลาดยิ่งขึ้น' (structured is smarter) การขยายขนาดมีประโยชน์จริง แต่หลักแล้วช่วยปรับปรุงประสิทธิภาพในงานที่คุ้นเคย ความสามารถในการเข้าใจเชิงนามธรรมและการถ่ายโอนแบบมนุษย์ ก็มีความสำคัญอย่างยิ่งสำหรับ AI เช่นกัน ซึ่งจำเป็นต้องทำให้โครงสร้างการคิดของ AI ใกล้เคียงกับสมองมนุษย์มากขึ้นในอนาคต คุณค่าของทิศทางนี้ อยู่ที่การดึงความสนใจของอุตสาหกรรมกลับมาที่โครงสร้างการรับรู้เอง จากการขยายขนาดเพียงอย่างเดียว

Neosoul กับอนาคต

สิ่งนี้ชี้ให้เห็นความเป็นไปได้ที่ใหญ่ยิ่งขึ้น นั่นคือวิวัฒนาการของ AI อาจไม่จำเป็นต้องเกิดขึ้นเฉพาะในขั้นตอนการฝึกฝนโมเดลเท่านั้น การฝึกฝนโมเดลสามารถกำหนดได้ว่า AI จะจัดระเบียบแนวคิดอย่างไร ก่อตัวโครงสร้างการตัดสินใจที่มีคุณภาพสูงขึ้นอย่างไร จากนั้นเมื่อเข้าสู่โลกแห่งความเป็นจริง อีกชั้นหนึ่งของวิวัฒนาการของ AI เพิ่งจะเริ่มต้นขึ้น: การตัดสินใจของ AI agent ถูกบันทึกอย่างไร ถูกตรวจสอบอย่างไร เติบโตและวิวัฒนาการอย่างต่อเนื่องในการแข่งขันกันอย่างแท้จริงอย่างไร เรียนรู้และวิวัฒนาการด้วยตนเองเหมือนมนุษย์ นี่คือสิ่งที่ Neosoul กำลังทำอยู่ในปัจจุบัน Neosoul ไม่เพียงแต่ให้ AI agent สร้างคำตอบ แต่ยังวาง AI agent ไว้ในระบบที่ทำนายอย่างต่อเนื่อง ตรวจสอบอย่างต่อเนื่อง ชำระบัญชีอย่างต่อเนื่อง และคัดกรองอย่างต่อเนื่อง เพื่อให้มันปรับปรุงตัวเองอย่างต่อเนื่องในการทำนายและผลลัพธ์ ให้โครงสร้างที่ดีกว่าถูกเก็บรักษาไว้ และให้โครงสร้างที่แย่กว่าถูกคัดออก สิ่งที่ทีมมหาวิทยาลัยเจ้อเจียงและ Neosoul ชี้ไปด้วยกัน จริงๆ แล้วคือเป้าหมายเดียวกัน: ทำให้ AI ไม่เพียงแต่แก้โจทย์ได้ แต่ยังต้องมีความสามารถในการคิดที่รอบด้าน และวิวัฒนาการอย่างต่อเนื่อง

Web 4.0

ยินดีต้อนรับเข้าร่วมชุมชนทางการของ Odaily