Microsoft ના નવા AI મોડલ્સ: Google અને OpenAI ને આપશે ટક્કર

ટેક જાયન્ટ Microsoft એ આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) ક્ષેત્રે પોતાની પકડ મજબૂત કરવા માટે ત્રણ નવા પાવરફુલ મોડલ્સ લોન્ચ કર્યા છે. રેડમન્ડ (Redmond) સ્થિત આ કંપનીએ દાવો કર્યો છે કે તેમના નવા મોડલ્સ ઇમેજ જનરેશન, વોઇસ ક્રિએશન અને સ્પીચ-ટુ-ટેક્સ્ટ ટ્રાન્સક્રિપ્શનમાં Google અને OpenAI કરતા પણ ચડિયાતું પ્રદર્શન કરે છે. આ મોડલ્સ ખાસ કરીને ઝડપી કન્ટેન્ટ બનાવવા અને ઓછી કિંમતે ઉપલબ્ધ કરાવવા પર ધ્યાન કેન્દ્રિત કરે છે.

Microsoft ના 3 નવા AI મોડલ્સ:

1. MAI-Transcribe-1:
આ મોડલ સ્પીચ-ટુ-ટેક્સ્ટ ટ્રાન્સક્રિપ્શન (Speech-to-Text Transcription) માટે તૈયાર કરવામાં આવ્યું છે. કંપનીનો દાવો છે કે તે વિશ્વની સૌથી વધુ બોલાતી 25 ભાષાઓમાં સચોટ પરિણામ આપે છે. ઇન્ટરનલ ટેસ્ટિંગ મુજબ, આ મોડલ એરર રેટ (Error Rate) ના મામલે Gemini 3.1 Flash અને GPT-Transcribe ને પણ પાછળ છોડી દે છે. તે યુઝર્સને બેસ્ટ પ્રાઇસ પરફોર્મન્સ (Best-price performance) પૂરો પાડે છે.

2. MAI-Voice-1:
આ મોડલ અસલી માનવી જેવો કુદરતી અવાજ (Natural Voice) જનરેટ કરવામાં સક્ષમ છે. આમાં લાગણીઓ (Emotions) અને અવાજના ઉતાર-ચઢાવ સ્પષ્ટપણે અનુભવી શકાય છે. તેની ખાસિયત એ છે કે તે માત્ર 1 સેકન્ડના પ્રોસેસિંગમાં 60 સેકન્ડની ઓડિયો ક્લિપ તૈયાર કરી શકે છે. આ ટેકનોલોજીનો ઉપયોગ Copilot Podcasts અને Audio Expressions માં પણ કરવામાં આવશે.

3. MAI-Image-2:
આ મોડલ ખાસ કરીને ફોટોગ્રાફર્સ અને ડિઝાઇનર્સ (Designers) માટે બનાવવામાં આવ્યું છે. તે નેચરલ લાઇટિંગ (Natural Lighting) અને સચોટ ટેક્સચર (Texture) સાથે હાઇ-ક્વોલિટી ઇમેજ બનાવે છે. આ મોડલ હવે Copilot, Bing અને PowerPoint જેવા પ્લેટફોર્મ્સ પર પણ ઉપલબ્ધ થશે.

આ તમામ મોડલ્સ હાલમાં Microsoft Foundry અને MAI Playground દ્વારા એક્સેસ કરી શકાય છે. કંપનીએ સુરક્ષાનું પણ ખાસ ધ્યાન રાખ્યું છે, જેથી વોઇસ ક્લોનિંગ જેવી સુવિધાઓનો દુરુપયોગ ન થાય.

Share this post:

X (Twitter) Facebook WhatsApp Telegram