چکیده
- دادهها به عنوان منبعی ارزشمند در رشد هوش مصنوعی شناخته میشوند و شرکتهایی مانند Vana به دنبال ایجاد اکوسیستمی برای دادههای تحت مالکیت کاربران هستند.
- دادههای شخصی تنها زمانی ارزشمند هستند که با دادههای دیگران ترکیب شوند و Vana به دنبال ایجاد بازارهای داده غیرمتمرکز برای این منظور است.
- همکاری با Flower Labs برای ساخت اولین مدل بنیادین تحت مالکیت کاربران به دنبال ایجاد هوش مصنوعی با عملکرد بهتر و غیرمتمرکز است.
شما هر روز در حال خلق دادههای جدیدی هستید. اگر برنامه سلامتی شما قدمهای شما را میشمارد، این یک داده جدید است. حلقه Oura که بیومتریک شما را دنبال میکند، دادههای ارزشمندی تولید میکند. حتی پستهای شما در شبکههای اجتماعی، هرچند که جکهای بیمزهای باشند که هیچ لایکی نگرفتهاند، داده محسوب میشوند.
این دادهها همان چیزی هستند که شرکتهای هوش مصنوعی برای جمعآوری آنها مشتاقاند. شما نمیتوانید هوش مصنوعی خوبی بسازید بدون دادههای خوب؛ به همین دلیل بسیاری دادهها را به عنوان “نفت جدید” در مسابقه هوش مصنوعی میدانند. مشکل اینجاست که دادههای شما در تئوری باارزشاند، اما واقعیت این است که کسب درآمد از دادههای شخصی شما سخت است، زیرا به عنوان یک فرد هیچ قدرت چانهزنی ندارید. (هوش مصنوعی Open AI در خانه شما را برای خرید توییتهای قدیمیتان نمیزند.)
وارد Vana شوید. “من فکر میکنم دادهها به عنوان یک منبع اساسی نیروی محرک نسل بعدی هوش مصنوعی و اقتصاد دیجیتال ما هستند.” این گفته آنا کازلاسکاس، یکی از بنیانگذاران Vana و مدیرعامل Open Data Labs است. “بسیاری از مردم واقعاً متوجه نمیشوند که آنها در واقع مالک دادههای خود هستند.”
اما شما مالک دادههای خود هستید و این دادهها ارزشمندند… اگر بتوانید به نوعی با میلیونها نفر دیگر که مالک دادههای خود هستند، متحد شوید. این به شما قدرت چانهزنی میدهد. و این مأموریت Vana است: ایجاد یک اکوسیستم برای دادههای تحت مالکیت کاربر که به نوبه خود به رشد هوش مصنوعی تحت مالکیت کاربر کمک میکند.
این اکوسیستم شامل ترکیبی از DAOهای داده (یک “اتحادیه کارگری” برای دادهها)، بازارهای غیرمتمرکز داده، توکن VRC-20 و همکاری جدید با Flower Labs برای ساخت اولین مدل بنیادی تحت مالکیت کاربران است. این نشانهای است که هوش مصنوعی غیرمتمرکز در حال ورود به جریان اصلی است: همکاری Vana/Flower توسط WIRED پوشش داده شد.
کازلاسکاس در AI Summit در Consensus 2025 این چشمانداز را به اشتراک خواهد گذاشت و او در اینجا نگاهی گذرا به آن دارد. او میبیند که جریانها در حال تغییر هستند. “ما در حال حاضر شروع به دیدن این تغییر کردهایم که بیشتر مردم متوجه میشوند، ‘دادههای من واقعاً برای هوش مصنوعی مهم است’ و ‘من در واقع مالک آن هستم.’ ” او پیشبینی میکند که در چند سال آینده، بیش از ۱۰۰ میلیون کاربر به این اکوسیستم خواهند پیوست. در ۱۰ سال آینده؟ “جمعیت جهان. بالای ۱۰ میلیارد.”
چرا دادههای تحت مالکیت کاربر برای شما اینقدر مهم است؟
آنا کازلاسکاس: اکثر مردم فرض میکنند دادهها به پلتفرمهایی که روی آنها قرار دارند، متعلق هستند، اما اینطور نیست. به همان شکلی که وقتی ماشین خود را در پارکینگ میگذارید، پارکینگ مالک ماشین شما نمیشود. شما همیشه میتوانید آن را پس بگیرید. شما مالک کامل آن هستید.
و امروز پول زیادی از این دادهها بهدست میآید، عمدتاً توسط شرکتهای بزرگ فناوری، اما کاربران مالک قانونی هستند. بنابراین من فکر میکنم مهم است که این مالکیت را هم از دیدگاه کاربر و هم از دیدگاه توسعهدهنده بازگردانیم.
چطور این به توسعهدهندگان کمک میکند؟
به عنوان یک توسعهدهنده، به ویژه در دنیای هوش مصنوعی، دسترسی به دادههای درست واقعاً مهم است. و اکنون بسیار سخت است، زیرا بیشتر دادهها در باغهای دیوارکشی شده شرکتهای بزرگ فناوری قفل هستند. بسیاری از دوستان من که در هوش مصنوعی کار میکنند، به آزمایشگاههای بزرگ میروند، زیرا دادهها و محاسبات در آنجا هستند. اما این نباید اینطور باشد.
DAOهای داده چگونه در این چشمانداز جا میگیرند؟
DAO دادهها به نوعی مانند یک اتحادیه کارگری برای دادهها هستند. جایی که اساساً گروه بزرگی از مردم دادههای خود را با هم ترکیب میکنند و سپس میتوانند تصمیمات جمعی درباره اینکه چه اتفاقی برای آن دادهها میافتد، بگیرند.
دلیل این که این مهم است این است که دادههای شما به تنهایی چندان مفید نیستند، درست است؟ وقتی یک مجموعه بزرگ از آن وجود داشته باشد، بسیار مفیدتر است. زمانی که به اندازه کافی از آن برای آموزش مدلهای هوش مصنوعی وجود داشته باشد.
کدام یک از DAOهای داده شما را بیشتر به هیجان میآورد؟
چند مورد در زمینه سلامت وجود دارد که واقعاً جالب هستند. یکی از موارد اولیه در حال انجام صادرات کامل پروندههای پزشکی بیماران است که فکر میکنم میتواند به پیشرفت زیادی در تحقیقات این حوزه کمک کند. برخی مرتبط با بیومتریک، خواب و سلامت هستند. یکی با DLP Labs در حال ساخت دادههای خودرو است. و در مجموعه دادههای آنها، دادههای تسلا واقعاً جالب است زیرا اکثر مردم فکر میکنند تسلا به دلیل پیشروی دادهها ارزشمند است، درست است؟ در واقع، کاربران میتوانند مقدار زیادی از آن مجموعه داده را بهدست آورند.
شما با همکاری با Flower Labs به سمت عمل در حال حرکت هستید. هدف از ساخت COLLECTIVE-1 چیست؟
COLLECTIVE-1 اولین مدل بنیادی تحت مالکیت کاربران است. معمولاً وقتی مردم به یک مدل بنیادی فکر میکنند، به طور معمول به یک شرکت فکر میکنند که یک پروژه آموزشی بسیار بزرگ را در یک مرکز داده واحد اجرا میکند، درست است؟ مانند OpenAI. و دلیل اینکه معمولاً به صورت متمرکز انجام میشود این است که، اول، به مقدار زیادی توان محاسباتی نیاز دارد و دوم، مقدار زیادی داده.
Flower AI از پیشروان در آموزش فدرال (غیرمتمرکز) است. آنها در ساخت این کتابخانههای متنباز عالی کار بزرگی انجام دادهاند. آنها از طرف آموزش و الگوریتم وارد شدهاند. و با Vana، ما واقعاً بر روی قسمت داده تمرکز داریم، درست است؟ بنابراین ما اساساً تمام این دادهها را داریم که مردم میتوانند بر روی آنها آموزش دهند. سپس شما به کاربران مالکیت نهایی مدل را میدهید و کاربران میتوانند تصمیم بگیرند که مدل چه کاری اجازه دارد انجام دهد؟ پس این اولین مدل بنیادی از نوع خود است.
و تئوری این است که با دادههای بهتر، میتوانید هوش مصنوعی بسازید که نه تنها با بازیکنان مرکزی رقابت کند، بلکه بهتر باشد، درست است؟ بنابراین این فقط درباره ایدئولوژی نیست، بلکه درباره عملکرد هم هست.
دقیقاً، بله این ۱۰۰٪ درست است. از یک زمینه غیرمتمرکز، فکر میکنم اغلب مردم به صورت اصولی موافق هستند که، “بله، ما باید هوش مصنوعیای داشته باشیم که توسط مردم مالکیت داشته باشد. ما باید هوش مصنوعی غیرمتمرکز داشته باشیم.” اما چیزی که ما واقعاً میتوانیم در یک زمینه غیرمتمرکز بهتر انجام دهیم چیست؟ دادهها جواب هستند. برای هر شرکت، آنها تنها یک قسمت محدود از یک مجموعه داده را دارند. اپل دادههای خود را دارد. گوگل دادههای خود را دارد. اما اگر از طریق کاربر بروید، میتوانید از پلتفرمها عبور کنید و واقعاً مجموعه دادههای بهتری از هر شرکت واحدی بسازید. دادهها راز موفقیت هستند که همه چیز را کارآمد میکند.
عالیه. مرسی آنا، در نشست هوش مصنوعی در تورنتو میبینمت.