இந்தப் பக்கம் அந்தப் பக்கம் எந்தப் பக்கம் திரும்பினாலும் Deepseek பற்றியே செய்திகள் உலவுகின்றன. மற்ற மொழி மாதிரிகளை விட அதிகமானோர் உபயோகப் படுத்துவதாக தகவல்கள் வந்துக் கொண்டேயிருக்கின்றன. போட்டி நிறுவனங்கள் வயிற்றை பிடித்துக் கொண்டு உட்கார்ந்திருக்கின்றன. அப்படி என்ன இருக்கிறது அதனுள். அதன் சாதகம் என்ன? அதனால் வரும் பாதகம் என்ன? என்று சிறிது பார்ப்போம்.
கடந்த சில கட்டுரைகளில் நாம் தொடர்ச்சியாக பல மொழி மாதிரிகளை பற்றி பார்த்திருக்கிறோம். இதை பற்றி ஏன் எழுதவில்லை என்ற கேள்வி எழலாம். அதனையும் சேர்த்து பார்ப்போம்.
Deepseek என்கிற இந்த செயற்கை நுண்ணறிவு மொழி மாதிரி 2023 ஆம் ஆண்டில் சீனாவின் ஹாங்சோவில் நிறுவப்பட்ட ஒரு செயற்கை நுண்ணறிவு (AI) நிறுவனத்தின் தயாரிப்பு ஆகும். இது சீனாவின் ஹெட்ஜ் ஃபண்ட் நிறுவனமான High-Flyerன் துணை நிறுவனமாகும். இதன் நிறுவனரும் தலைமை நிர்வாக அதிகாரியுமான லியாங் வென்ஃபெங் (Liang Wenfeng), AI தொழில்நுட்ப வளர்ச்சியில் புதிய சாதனைகளை எட்ட காத்துக் கொண்டிருக்கிறார்.
DeepSeek நிறுவனத்தின் முக்கிய நோக்கமே, ஓப்பன் சோர்ஸ் (open-source அதாவது அனைத்தும் அனைவருக்கும் என்கிற) பெரிய மொழி மாதிரிகளை (Large Language Models - LLMs) உருவாக்குவது ஆகும். இது OpenAI போன்ற தனியார் நிறுவனங்களால் உருவாக்கப்பட்டுள்ள (closed-source) மாதிரிகளை விட, திறந்த மற்றும் எளிதில் அணுகக்கூடிய வடிவத்தில் செயல்படுகிறது. இதன் பலம் இதுதான்.
DeepSeek உருவாக்கிய DeepSeek-R1 மாடல், Chat GPT-4 போன்ற சமகால LLMகளுடன் ஒப்பிடும்போது, குறைந்த செலவில் மற்றும் குறைந்த கணினி வளங்களைப் பயன்படுத்தி சமமான பதில்களை வழங்குகிறது. இது AI வல்லுநர்கள் மற்றும் ஆராய்ச்சியாளர்களுக்கு நவீன LLM தொழில்நுட்பத்தை விரிவாக பயன்படுத்த அனுமதிக்கிறது முற்றிலும் இலவசமாக.
DeepSeek நிறுவனம் தொடர்ந்து அதன் AI மாதிரிகளை மேம்படுத்தி வருகிறது. DeepSeek-V3 என்பது 14.8 டிரில்லியன் (14.8 போட்டு 12 ஜீரோக்களை போட்டுக் கொள்ளுங்கள்) தரவுகளைக் கொண்டு பயிற்சி பெற்ற ஒரு மிகப்பெரிய மொழி மாதிரி ஆகும். இதில் 671 பில்லியன் பராமிட்டர்கள் உள்ளன அதாவது கேள்விக்கான அமைப்பு. இது இதற்கு முன் வெளியிடப்பட்ட மற்ற LLMகளை விட மிகவும் மேம்பட்ட செயல்திறனை வழங்குகிறது.
DeepSeek நிறுவனத்தின் வளர்ச்சி, சீனாவின் AI துறையில் முன்னேற்றத்தைக் காட்டுகிறது. OpenAI, Google Gemini போன்றஅமெரிக்க நிறுவனங்கள் முதன்மையாக செயல்பட்டு வரும் நிலையில், DeepSeek போன்ற ஆசிய நிறுவனங்கள் சீனாவின் AI ஆராய்ச்சியில் புதியதொரு அத்தியாயத்தை தொடங்கியுள்ளன. இப்பொழுது அவர்களைத் தாண்டி முதன்மையாக இருக்கிறது.
அதன் திறமையான LLMகள், செயல்திறன் மற்றும் பயன்பாட்டு வசதிகளில் முன்னேற்றம் பெற்றுள்ளதால், எதிர்காலத்தில் DeepSeek, செயற்கை நுண்ணறிவு உலகில் முக்கியமான இடத்தைப் பிடிக்கும் என்று எதிர்பார்க்கப்படுகிறது.
சரி, இவ்வளவு சாதகங்கள் இருக்கும் இதனை ஏன் அறிமுகப் படுத்தவில்லை என்றால் இது மற்றுமொரு சீனத் தயாரிப்பு. அதன் செயல் திறன் பற்றி சொல்லத் தேவையில்லை. அதோடு இல்லாமல் இந்த மொழி மாதிரி open AI நிறுவனத்தின் Chat GPTயை போன்றே இயங்குகிறது. கிட்டத்தட்ட Cloning போன்று தான் நம் கேள்விக்கான விடைகள் கிடைக்கின்றன. ஆயினும் இது இவ்வளவு பிரபலமாகுவதற்கு காரணம் முற்றிலும் இலவசம், அல்லது குறைந்த கட்டணம். மற்ற மொழி மாதிரிகளுக்கு ஒரு மாதத்திற்கு செலவிடும் பணத்தை வைத்து ஒரு வருடத்திற்கு இதில் உபயோகித்து விடலாம். மற்றும் முக்கியமான விஷயமாக இதனை ஆதரிக்காததன் நோக்கம் பாதுகாப்பு விஷயம் தான். நம் தகவல்கள் தேடல்கள் அனைத்தையும் அது தன்னுடைய இயக்கத்திற்கு பயன்படுத்துகிறது என்பதே பெரிய குற்றச்சாட்டு. இது மற்ற போட்டி நிறுவனங்களின் பொறாமையின் வெளிப்பாடாகவும் இருக்கலாம்.
நான் இரண்டு மாதமாக உபயோகித்துப் பார்த்ததில் ஓகே என்று தான் கூறுவேன். Claude மற்றும் ChatGPT போன்று இல்லை. அதனால் இதனை அறிமுகம் செய்யும் எண்ணம் இல்லை. இலவசம் மற்றும் குறைந்த கட்டணத்திற்காக இதனை உபயோகப் படுத்திப் பார்க்கலாம். இதே போன்று ஒரு செயற்கை நுண்ணறிவு மொழி மாதிரியை நமது பாரதமும் வெளியிட வேண்டும் என்பதே என் போன்ற சாதாரணமானவர்களின் வேண்டுகோள்.
-S.B.
Yes
ReplyDeletePost a Comment