แพ็กเกจ 20 ดอลลาร์ต่อเดือน กำลังทำให้บริษัท AI เติบโตอย่างยากลำบาก การลดราคาของ Token เป็นแค่ภาพมายา ความจริงแล้ว สิ่งที่แพงที่สุดคือความโลภของคุณ — เรียนรู้ AI อย่างช้าๆ 164
เขียนเพื่อเริ่มต้น
- การลดราคาโมเดลเป็นเพียงหัวข้อที่ไม่เป็นจริง: สิ่งที่ลดราคาเป็นโมเดลเก่าที่ไม่มีคนใช้งาน ผู้ใช้ยอมจ่ายเฉพาะสำหรับ “เรือธงใหม่” ที่มีศักยภาพสูงสุด
- หลุมดำของต้นทุนที่แท้จริงไม่ใช่ราคาต่อ Token แต่คือการพัฒนาความสามารถของ AI: งานที่ซับซ้อนมากขึ้น ค่าใช้จ่ายจะควบคุมไม่ได้ และรูปแบบค่าใช้จ่ายต่อเดือนคงที่จะถูก “กดดัน”
- รูปแบบการสมัครสมาชิก AI เป็นเกม “ดักนักโทษ”: หากเลือกที่จะจ่ายตามการใช้งาน คุณจะเสียโอกาสในตลาด; หากเลือกการกำหนดราคาแบบรายเดือน คุณจะเสียอนาคต
- เส้นทางเดียวที่จะหลุดพ้นจากชะตากรรม “เผาเงิน” มีเพียงสองทาง: สร้าง “กำแพงป้องกัน” ด้วยต้นทุนการเปลี่ยนแปลงที่สูง เพื่อทำให้ลูกค้าบริษัทไม่สามารถจากไปได้; หรือทำการรวมแนวดิ่ง ใช้ AI เป็นเครื่องมือดึงดูดลูกค้าแม้ต้องขาดทุน โดยใช้โครงสร้างพื้นฐานเป็นช่องทางทำกำไร
บทความเพิ่มเติม
- 【ข้อเท็จจริงเกี่ยวกับ Token】ทำไมการคิดค่าบริการ AI ถึงต้องเป็นตาม Token? มาหาคำตอบกัน
- 【เข้าใจง่าย】7B, 70B, 175B? พารามิเตอร์โมเดล AI มีความหมายว่าอย่างไร? บริษัทจะเลือกแผนโมเดลขนาดใหญ่ได้อย่างไร?
- tokens กำลังแพงขึ้น
ต้นทุนที่แท้จริงของ Token กำลังพุ่งสูงขึ้น
คำพูดที่ว่า “ต้นทุนโมเดลภาษาจะลดลง 10 เท่า” เป็นเพียงความเชื่อที่ไม่อาจช่วยชีวิตบริการสมัครสมาชิก AI ที่ถูก “กดต้นทุน”
จินตนาการถึงตัวคุณที่ก่อตั้งบริษัท และรู้ว่าผู้บริโภคจะยอมจ่ายสูงสุดเพียง 20 ดอลลาร์ต่อเดือน คุณคิดว่า “ไม่มีปัญหา นี่คือวิธีการของ VC ที่คุ้นเคย” — จ่ายตามต้นทุน เพื่อแลกกับการเติบโต แม้ว่าคุณได้คำนวณต้นทุนการได้มาซึ่งลูกค้า (CAC) และมูลค่าตลอดชีพของลูกค้า (LTV) อย่างครบถ้วน แต่สิ่งที่น่าสนใจเกิดขึ้น: คุณเห็นกราฟ a16z ที่แสดงให้เห็นว่าต้นทุนของโมเดลภาษาขนาดใหญ่ (LLM) ลดลง 10 เท่าทุกปี
คุณจึงคิดว่า: วันนี้ในราคานี้ที่ 20 ดอลลาร์/เดือน คุณจะเข้าข่ายเฉลี่ยต้นทุนในปีหน้า ถ้าต้นทุนลดลง 10 เท่า อัตรากำไรก็จะสูงถึง 90% ขาดทุนเป็นแค่ชั่วคราว กำไรเป็นสิ่งที่แน่นอน
ตรรกะนี้เรียบง่ายจนแม้แต่ผู้ช่วย VC ก็เข้าใจได้:
- ปีแรก: บรรลุจุดคุ้มทุนที่ราคา 20 ดอลลาร์/เดือน
- ปีที่สอง: เมื่อค่าคอมพิวเตอร์ลดลง 10 เท่า อัตรากำไรจะถึง 90%
- ปีที่สาม: เริ่มเลือกซื้อยอชต์
กลยุทธ์นี้สามารถเข้าใจได้: “ต้นทุนการให้บริการของโมเดลภาษาขนาดใหญ่ลดลง 3 เท่าทุก 6 เดือน ดังนั้นเราต้องทำได้”
แต่ผ่านมา 18 เดือน อัตรากำไรก็ยังคงอยู่ในระดับติดลบที่ไม่เคยมีมาก่อน……โครงการ Windsurf กำลังจะล่มสลาย และแม้แต่ Claude Code ก็ต้องยกเลิกแพ็กเกจไม่จำกัดครั้งเริ่มต้นที่ 200 ดอลลาร์/เดือน ในสัปดาห์นี้
บริษัทกำลังขาดทุนอย่างต่อเนื่อง โมเดลนั้นลดราคาลงแล้ว — ต้นทุน GPT-3.5 ต่ำกว่าที่เคยถึง 10 เท่า แต่ด้วยเหตุผลบางประการ อัตรากำไรก็กลับยิ่งแย่ลง
ที่ตรงนี้ต้องมีปัญหาอยู่แน่ ๆ
โมเดลเก่าที่ล้าสมัย เปรียบเสมือนหนังสือพิมพ์เมื่อวาน
ราคาของ GPT-3.5 คือหนึ่งในสิบของราคาที่ผ่านมา แต่เมื่อเปรียบเทียบกับโทรศัพท์มือถือที่โชว์ในงานเปิดตัว iPhone กลับไม่มีใครสนใจ
เมื่อโมเดลใหม่ถูกเปิดตัวในฐานะผู้นำตลาด (SOTA) ความต้องการ 99% จะเปลี่ยนไปที่โมเดลนั้นทันที ผู้บริโภคมีความคาดหวังในผลิตภัณฑ์ที่ใช้บริการเช่นเดียวกัน
ตอนนี้มาดูประวัติราคาจริงของโมเดลแนวหน้าที่มีความต้องการอยู่ตลอดเวลา 99%:
คุณสังเกตเห็นอะไรไหม?
- เมื่อ GPT-4 ถูกเปิดตัวที่ราคา 60 ดอลลาร์ แม้ว่า GPT-3.5 (โมเดลที่แล้ว) จะลดราคา 26 เท่า แต่ทุกคนกลับเลือก GPT-4
- เมื่อ Claude 3 Opus เปิดตัวที่ราคา 60 ดอลลาร์ แม้ว่า GPT-4 จะลดราคาแล้ว คนก็ยังเลือก Claude
การลดราคา 10 เท่าเป็นเรื่องที่มีอยู่จริง แต่ถูกจำกัดอยู่ที่โมเดลเก่าที่ประสิทธิภาพเทียบกับคอมพิวเตอร์รุ่นเก่าอย่าง Commodore 64
นี่คือข้อบกพร่องแรกของยุทธศาสตร์ “ต้นทุนจะลดลง”: ความต้องการในตลาดมีอยู่เฉพาะใน “โมเดลภาษาที่แข็งแกร่งที่สุด” เท่านั้น และต้นทุนของโมเดลที่แข็งแกร่งที่สุดก็มักจะอยู่ในระดับใกล้เคียงกัน เนื่องจากสะท้อนถึงต้นทุนที่เป็นขีดจำกัดของเทคโนโลยีการให้บริการในขณะนั้น
การบอกว่า “รถฮอนด้าปี 1995 ราคาถูกลงมาก!” เป็นวิธีการที่ไม่ตรงประเด็น ใช่ รถคันนั้นราคาถูกลง แต่ราคาของ Toyota Camry ปี 2025 ยังคงแนะนำว่าที่ 30,000 ดอลลาร์
เมื่อคุณใช้ AI — ไม่ว่าจะเป็นการเขียนโปรแกรม การเขียน หรือการคิด — คุณมักจะมองหาคุณภาพที่ดีที่สุด ไม่มีใครจะเปิด Claude แล้วพูดว่า “ทำไมไม่ใช้เวอร์ชันที่แย่กว่า เพื่อช่วยนาย?” เรามีความโลภในระดับจิตวิญญาณ เราต้องการ “สมอง” ที่ดีที่สุดที่เราได้รับ โดยเฉพาะเมื่อมันเกี่ยวข้องกับเวลาที่มีค่า
ความเร็วในการเผาเงินของโมเดล อาจเกินจินตนาการของคุณ
“ดีแล้ว แต่ฟังดูพอรับได้ใช่ไหม? เราแค่ต้องอยู่ในจุดคุ้มทุนตลอดเวลา”
โอ้ เด็กน้อยของฉัน
แม้ว่าต้นทุนหนึ่ง Token ของโมเดลแนวหน้าแต่ละรุ่นจะไม่ได้แพงขึ้น แต่สิ่งที่เลวร้ายกว่านั้นคือ: จำนวน Token ที่พวกเขาใช้จ่ายแตกต่างกันออกไปในระดับมหาศาล
ในอดีต ChatGPT ใช้เวลาเพียงแค่ประโยคเดียวในการตอบ แต่ตอนนี้ “ฟังก์ชันการวิจัยเชิงลึก” จะใช้เวลา 3 นาทีในการวางแผน, 20 นาทีในการอ่าน และอีก 5 นาทีในการเขียนรายงานใหม่ ขณะที่ Opus 3 อาจใช้เวลา 20 นาทีในการตอบคำว่า “สวัสดี”
การพัฒนาแบบเสริมสร้างการเรียนรู้ (RL) และการคำนวณในช่วงการทดสอบ (test-time compute) เป็นอัตราเร่งที่เหนือคาดหมาย นำไปสู่ผลลัพธ์ที่ไม่สามารถคาดคิดได้: ความยาวของงานที่ AI สามารถทำได้เพิ่มขึ้นเป็นสองเท่าทุกหกเดือน งานที่เคยมีเพียง 1,000 Token ตอนนี้รองรับสูงถึง 100,000 Token
เมื่อคุณนำแนวโน้มนี้มาวิเคราะห์ ตัวเลขทางคณิตศาสตร์จะกลายเป็นเรื่องที่บ้าคลั่ง:
วันนี้ การทำ “การวิจัยเชิงลึก” 20 นาทีมีค่าใช้จ่ายประมาณ 1 ดอลลาร์ เมื่อถึงปี 2027 เราจะมีบริษัทที่สามารถทำงานติดต่อกัน 24 ชั่วโมงโดยไม่ “หลงลืม” … และเมื่อรวมกับราคาที่คงที่ของโมเดลขนาดใหญ่? หมายความว่าค่าใช้จ่ายในการทำงานครั้งเดียวสูงถึง 72 ดอลลาร์ต่อวัน ต่อผู้ใช้ และสามารถทำงานหลายอย่างได้แบบไม่ซิงค์
เมื่อเราได้ดึงเอาอัจฉริยะขึ้นมาเพื่อทำงานตลอด 24 ชั่วโมง เราจะไม่เพียงแค่ให้มันทำตามคำสั่งและรอคอยผลลัพธ์ เราจะมีการจัดตั้งการปฏิบัติงานทั้งหมดเป็นปริมาณ กองทัพแรงงาน AI ที่ประสานการจัดการปัญหา และเผา Token เหมือนกับยุคฟองสบู่อินเทอร์เน็ตในปี 1999
ชัดเจนว่าฉันต้องเน้นย้ำจุดนี้ — ค่าใช้จ่าย 20 ดอลลาร์ต่อเดือนไม่สามารถสนับสนุนการทำการวิจัยเชิงลึกวันละ 1 ดอลลาร์สำหรับผู้ใช้คนหนึ่งได้เลย แต่ชะตากรรมที่เรามีจะเปิดเผยในอนาคต โมเดลที่มีศักยภาพเพิ่มขึ้น จะหมายถึงการใช้ทรัพยากรในการคำนวณมากขึ้นอีก
มันเหมือนกับว่าคุณสร้างเครื่องยนต์ที่ใช้น้ำมันน้อยลง จากนั้นนำไปใช้ประโยชน์ของน้ำมันที่ประหยัดได้ไปสร้างรถบรรทุกขนาดยักษ์ ใช่ น้ำมันหนึ่งแกลลอนช่วยให้คุณเคลื่อนไหวได้ไกลขึ้น แต่ปริมาณน้ำมันที่คุณต้องใช้รวมตอนนี้ก็เพิ่มขึ้นถึง 50 เท่า
นี่คือเหตุผลที่บังคับให้ Windsurf ต้อง “กดราคา” จนถึงจุดที่ไม่สามารถดำรงชีวิตได้ — และคือวิกฤตที่ประชาชนทุกคนที่ใช้งานรูปแบบธุรกิจ “การสมัครที่อัตราคงที่ + การใช้ Token จากมาก” ต้องเผชิญ
ความพยายามอย่างกล้าหาญของ Anthropic ในการป้องกัน “ต้นทุนกดดัน”
การทดลองแพ็กเกจไม่จำกัดของ Claude Code คือความพยายามที่ชาญฉลาดและบริหารจัดการมาเป็นอย่างดีที่เราหลายคนได้พบ แต่ท้ายที่สุดมันก็ไม่สามารถเอาชนะได้
กลยุทธ์ของพวกเขานั้นฉลาดมาก:
1. ตั้งราคาให้สูงขึ้น 10 เท่า
เมื่อ Cursor ตั้งราคาไว้ที่ 20 ดอลลาร์/เดือน พวกเขาก็ใช้ราคา 200 ดอลลาร์/เดือน โดยให้มีพื้นที่ว่างเพิ่มเติมก่อนที่จะเกิดการขาดทุน
2. ปรับขนาดของโมเดลอัตโนมัติตามการโหลดผลิตภัณฑ์
เมื่อพบกับปัญหางานหนัก สามารถสลับไปที่ Opus (75 ดอลลาร์/ล้าน Token) และ Sonnet (15 ดอลลาร์/ล้าน Token) ใช้ Haiku เพื่อปรับรูปแบบการอ่าน ซึ่งปฏิบัติงานคล้าย AWS ที่ปรับขนาดอัตโนมัติ แต่ใช้กับ “สมอง”
พวกเขามั่นใจในพฤติกรรมนี้ว่าถูกบรรจุเข้าสู่พันธุกรรมของโมเดลซึ่งเป็นลักษณะใหม่ที่อาจจะปรากฏในอนาคตได้
3. ส่งมอบงานให้กับเครื่องจักรของผู้ใช้
เมื่อผู้ใช้มี CPU ที่ไม่ใช้ประโยชน์ ทำไมต้องเริ่มดำเนินการแต่ต้นเองด้วย?
แต่ถึงจะมีเครื่องมือสร้างสรรค์มากมาย การใช้ Token ยังคงเติบโตอย่างไม่สามารถควบคุมได้
หนึ่งหมื่นล้าน หนึ่งหมื่นล้าน Token จริง ๆ สิ่งนี้เท่ากับหนังสือ 12,500 เล่ม “สงครามและสันติภาพ” ในหนึ่งเดือน
ทำอย่างไร? แม้ว่าการทำงานครั้งละ 10 นาทีจะดี มันสามารถนำไปสู่การใช้ 100 Billion Token ได้อย่างไร?
ปรากฏว่าการดำเนินต่อเนื่อง 10-20 นาที ช่วยให้คนไข้แนว “for loop” และพอคุณแยกการใช้ Token ต่อการเวลาทำงานในแอปออกจากกัน กฎกายภาพจะควบคุมทุกอย่าง
ให้ Claude รับงาน ตรวจสอบผลงานของมันเอง รีวิวใหม่ แล้วทำซ้ำ จนบริษัทล้มละลาย
ผู้ใช้กลายเป็นผู้ควบคุม API ใช้เงินของ Anthropic รันเครื่องมือแปลโค้ดตลอด 24 ชั่วโมง ทุกอย่างเกิดขึ้นจากการสนทนาสู่การสร้างสรรค์ภายในคืนเดียว นั่นคือการเปลี่ยนแปลงที่เกิดขึ้นอย่างกระทันหันอย่างแท้จริง
ดังนั้น Anthropic ต้องยกเลิกแพ็กเกจไม่จำกัด พวกเขาสามารถจะลองตั้งราคา 2,000 ดอลลาร์/เดือน แต่บทเรียนไม่ได้อยู่ที่คิดค่าบริการไม่สูงพอ แต่คือ ในโลกใหม่นี้ ไม่ว่ารูปแบบการสมัครสมาชิกไหนก็ตาม ไม่สามารถเสนอการใช้บริการอย่างไม่จำกัดได้
จุดสำคัญคือ: ในโลกใหม่นี้ ไม่มีราคาสำหรับการสมัครสมาชิกที่สามารถใช้งานได้จริง
บัญชีรายนี้ คิดเลขไม่ได้ด้วยเหตุผลพื้นฐาน
เกมดักนักโทษสำหรับบริษัทอื่น ๆ
มันสร้างวิกฤตการณ์ที่ไม่สามารถแก้ไขได้ให้กับบริษัทอื่นทั้งหมด
บริษัท AI ทั้งหมดทราบดีว่าการคิดค่าบริการตามการใช้งานสามารถที่จะช่วยพวกเขาได้ พวกเขายังรู้ว่ามันจะทำให้พวกเขาล้มเหลวอีกด้วย เมื่อคุณได้รับการสนับสนุนจาก VC ด้วยการคิดค่าบริการ Token ที่ราคา $0.01/1 k Token คู่แข่งของคุณกำลังเสนอแพ็กเกจไม่จำกัดในราคา 20 ดอลลาร์ต่อเดือน
คุณคาดเดาได้ไหมว่าผู้ใช้จะไปไหน?
เป็นบทบาทคลาสสิกของเกมดักนักโทษ:
- ทุกคนชำระเงินตามการใช้ → อุตสาหกรรมยั่งยืน
- ทุกคนชำระด้วยอัตราคงที่ → ชิงเก้าอี้จนล้มละลาย
- คุณชำระตามการใช้ คนอื่นจ่ายในอัตราคงที่ → คุณจะแย่คนเดียว
- คุณชำระด้วยอัตราคงที่ เท่านั้น คนอื่นจ่ายตามการใช้ → คุณชนะ (แล้วค่อยตายทีหลัง)
ด้วยเหตุนี้ทุกคนจึงเลือก “หักหลัง” ทุกคนเป็นผู้สนับสนุนผู้ใช้ที่มีการใช้บริการสูง ทุกคนเผยแพร่กราฟการเติบโตที่น่าทึ่ง ทุกคนจึงเสนอ “ข่าวสารอัปเดตราคา” ที่สำคัญ
Cursor, Lovable, Replit — พวกเขาทั้งหมดรู้ดีถึงเรื่องนี้ พวกเขาเลือกที่จะเติบโตในวันนี้ หาผลกำไรในวันพรุ่งนี้ และค่อยล้มละลายในภายหลัง แต่เป็นปัญหาของ CEO คนถัดไป
พูดตามตรง? บางทีนั่นอาจถูกต้อง ในเกมการคว้าโอกาส ส่วนแบ่งการตลาดนั้นมีค่ามากกว่าผลกำไร เช่นเดียวกับที่ VC ยังคงพร้อมจ่ายเช็คเพื่อกลบโมเดลเศรษฐกิจที่เลวร้าย……
ไปถาม Jasper ว่าจะเกิดอะไรขึ้นเมื่อดนตรีหยุด
วิธีหลีกเลี่ยงการถูก “บังคับล้ม”
เรายังมีโอกาสที่จะหลีกเลี่ยง “การกดต้นทุน” ของ Token ไหม?
เมื่อเร็ว ๆ นี้มีข่าวลือว่า Cognition กำลังหาทุนในมูลค่า 15,000 ล้านดอลลาร์ ในขณะที่ลดรายได้ประจำปีที่เปิดเผย (ARR) ลงเหลือไม่ถึง 100 ล้านดอลลาร์ (ฉันคาดว่าใกล้เคียง 50 ล้านดอลลาร์) ซึ่งแตกต่างจาก Cursor ที่หาทุนได้ 100,000 ล้านดอลลาร์จาก ARR 500 ล้านดอลลาร์ รายได้สูงขึ้นถึงแปดเท่า แต่การประเมินกลับน้อยกว่า 2 ใน 3 VC รู้เรื่องอะไรเกี่ยวกับความลับของ Cognition ที่เรายังไม่รู้? พวกมันเป็นตัว AI ที่เขียนโค้ดได้ แล้ว Cognition จะหาวิธีหลีกเลี่ยงการวนลูปแห่งความตายนี้ได้อย่างไร? (ในครั้งถัดไปฉันจะเจาะลึกในหัวข้อนี้)
เรามีสามทางออก:
1. เริ่มใช้ตามการใช้งานตั้งแต่วันแรก
ไม่มีการสนับสนุน ไม่มี “ได้ลูกค้าก่อนแล้วค่อยมาลงทุน” มีแต่โมเดลเศรษฐกิจที่ซื่อสัตย์ ฟังดูเหมือนดีในทางทฤษฎี
แต่ปัญหาคือ หาตัวอย่างบริษัท AI ระดับผู้บริโภคที่เติบโตจากการคิดค่าบริการตามการใช้มาให้ดูหน่อย ผู้บริโภคไม่ชอบการคิดค่าบริการตามการใช้ พวกเขายินดีจ่ายมากขึ้นในแพ็กเกจไม่จำกัดแทนที่จะได้รับบิลที่ไม่คาดคิด บริการสมาชิกผู้บริโภคที่ประสบความสำเร็จทุกตัว - Netflix, Spotify, ChatGPT - เป็นแบบอัตราคงที่ เมื่อใดก็ตามที่คุณเพิ่มส่วนวัด สิ่งต่าง ๆ ก็จบลงทันที
2. ต้นทุนการทำธุรกรรมสูง ⇒ อัตรากำไรสูง
นี่คือแนวทางที่ Devin มุ่งมั่น พวกเขาเพิ่งประกาศความร่วมมือกับ Citibank และ Goldman Sachs จะดำเนินการจัดหา Devin สำหรับวิศวกรซอฟต์แวร์ทั้ง 40,000 คนของบริษัท มูลค่าโครงการนั้นคือ 10 ล้านดอลลาร์ ซึ่งจะคิดค่าบริการ 20 ดอลลาร์ต่อเดือน แต่คำถามคือ คุณจะเลือกทำ ARR 10 ล้านดอลลาร์จาก Goldman Sachs หรือ 500 ล้านดอลลาร์จากนักพัฒนามืออาชีพ?
คำตอบชัดเจน: วงจรการทำงานที่นานถึงหกเดือน การตรวจสอบความสอดคล้อง การตรวจสอบความปลอดภัย และกระบวนการจัดซื้อที่ซับซ้อน ทำให้แม้เงินจาก Goldman นั้นยากที่จะได้มา แต่เมื่อได้มาแล้วก็ ป้องกันไม่ให้เกิดการสูญเสีย คุณจะสามารถรับเอกสารเหล่านี้ได้ก็ต่อเมื่อผู้ตัดสินใจหลักของธนาคารทำให้ชื่อเสียงของตนอยู่ในอันตราย — แล้วทุกคนจะตั้งใจทำให้โครงการประสบความสำเร็จ
นี่คือเหตุผลที่บริษัทซอฟต์แวร์ที่ใหญ่ที่สุด ล้วนเป็นบริษัทยักษ์ใหญ่ที่ขาย “ระบบบันทึก” (System-of-Record) (เช่น CRM/ERP/EHRs) นอกเหนือจากผู้ให้บริการคลาวด์ขนาดใหญ่ ยังมีผลกำไร 80-90% เพราะลูกค้าเสี่ยงที่จะเลิกใช้บริการน้อยลงตามกลไกของราคา
เมื่อคู่แข่งมาปรากฏขึ้น คุณได้ซึมซับระบบราชการของตนไปแล้ว การเปลี่ยนผู้ให้บริการต้องใช้เวลาขายที่อีกหกเดือน ไม่ได้หมายความว่าคุณไม่สามารถออกไป แต่ CFO จะไม่อยากประสบการณ์การประเมินผู้ให้บริการอีก
3. การบูรณาการแนวตั้ง ⇒ การทำกำไรจากโครงสร้างพื้นฐาน
นี่คือวิธีการของ Replit: การรวมตัวของตัวสร้างโค้ดกับการจัดการแอปพลิเคชัน การควบคุมฐานข้อมูล การติดตามการปรับใช้ และการบันทึกข้อมูล ในทุก ๆ Token ที่ขาดทุน แต่ในทุกระดับอื่น ๆ ของเทคโนโลยีสแตกเพื่อมอบค่าสูงขึ้น……ลองดูความลึกในการบูรณาการของ Replit ได้
มองว่า AI เป็นผลิตภัณฑ์ที่ทำให้ขาดทุนเพื่อดึงดูดให้มีการใช้บริการที่สามารถแข่งขันกับ AWS ขายไม่ใช่ความสามารถในการให้บริการ แต่เป็นสิ่งอื่น ๆ ทั้งหมด ความสามารถในการให้บริการเป็นเพียงการตลาดของคุณ
ข้อดีคือ เนื่องจากการสร้างโค้ดสร้างความต้องการในการโฮสต์โดยธรรมชาติ ทุกแอปพลิเคชันต้องมีทำงาน มีการจัดการฐานข้อมูล และทุกการพัฒนามีการติดตาม ให้ OpenAI และ Anthropic ทำสงครามราคาบนบริการที่ให้การคิดค่าบริการ การแข่งขันจนไม่มีผลกำไรในขณะที่คุณมีทุกสิ่งทุกอย่างอื่นอยู่ในมือ
บริษัทที่ยังเล่นเกม “อัตราคงที่ เติบโตแบบไม่คิดอะไร” ถูกดูเหมือนศพเดินได้ โดยที่การฝังศพราคาแพงถูกเตรียมไว้ในไตรมาสที่สี่
ทางข้างหน้า
ฉันมักจะเห็นผู้ก่อตั้งชี้ไปที่ข้อความ “ปีหน้าโมเดลจะถูกลง 10 เท่า!” ดูเหมือนว่าจับจับก้านทอง แต่มันจะเป็นจริง แต่ความคาดหวังของผู้ใช้จากโมเดลก็ยังจะเพิ่มขึ้น 20 เท่า เป้าหมายนั้นจะถอยห่างออกไปอย่างรวดเร็ว
ยังจำ Windsurf ได้ไหม? เนื่องจากแรงกดดันจากรายได้ของ Cursor พวกเขาจึงไม่สามารถหาทางออกจากวิกฤตครั้งนี้ได้ แม้แต่ Anthropic ที่มีแอปพลิเคชั่นที่บูรณาการแนวตั้งมากที่สุดในโลก ก็ไม่สามารถทำให้โมเดลการสมัครใช้งานไม่จำกัดดำเนินไปได้
ถึงแม้การสรุปในบทความ “เบต้าเลเวอเรจคือสิ่งที่คุณต้องการ” — หรือ “การก้าวไปข้างหน้ามือชัยเท่ากับความเฉลียวฉลาด” — ยังคงเป็นจริง แต่การก้าวไปข้างหน้าโดยไม่มีแผนเพียงหมายความว่าคุณไปถึงหลุมศพก่อนคนอื่น ไม่มี Google ที่จะเสนอเช็ค 2.4 พันล้านดอลลาร์สำหรับธุรกิจที่ขาดทุน และไม่มี “เราจะหาวิธีในครั้งหน้า” เพราะ “ครั้งหน้า” หมายถึงบิล AWS ของคุณจะสูงกว่า รายได้รวมของคุณ
ดังนั้น ในโลกนี้ คุณจะสร้างบริษัทอย่างไร? คำตอบสั้นคือ กลายเป็น “คลาวด์ใหม่” (neocloud) — ซึ่งจะเป็นหัวข้อในบทความถัดไปของฉัน
แต่น้อยที่สุด ปีหน้า โมเดลจะต้องถูกลง 10 เท่า จริงหรือไม่