19 მაისი 2021 - 11:41

რა კრიტერიუმებს უნდა ვაკმაყოფილებდე და რა უნდა ვიცოდე, რომ მონაცემთა მეცნიერად ვიმუშაო?

ფოტო: shutterstock.com

დიდი მონაცემების ანალიზს დღეისათვის ბევრ სხვადასხვა სფეროში იყენებენ. ეს შეიძლება ეხებოდეს როგორც საცალო ვაჭრობასა და ტურიზმს, ასევე, განათლებასა და მედიცინას. შესაბამისად, მონაცემთა მეცნიერის, იმავე „დატა საიენტისტის“ (Data Scientist) პროფესია წლიდან წლამდე ერთ-ერთი ყველაზე მოთხოვნადი ხდება. თუმცა ერთი შეხედვით, მისი ათვისება არც ისე ადვილია. არსებობს გარკვეული შიშისა და სიფრთხილის შეგრძნება, რომელიც ამ მიმართულებით ადამიანის განვითარებას აფერხებს. 


მონაცემთა შესახებ თანამედროვე მეცნიერება შეიძლება ორ კატეგორიად დაიყოს: მონაცემთა ანალიზი (თავად Data Science-ი) და მანქანური სწავლება (Machine Learning-ი). მონაცემთა მეცნიერის ამოცანაა გარკვეული კანონზომიერების დადგენა და სხვადასხვა ბიზნეს პრობლემის გადასაჭრელად სწორედ მისი გამოყენება. მაგალითად, მონაცემთა ბაზა ბანკებს მომხმარებელთა ხარჯების პროგნოზირებასა და მათთვის ინდივიდუალური შეთავაზებების შემუშავებაში ეხმარება. მანქანური სწავლების სპეციალისტის ამოცანა კი არის, მანქანას ავტომატური პროგნოზების გაკეთება ასწავლოს. მაგალითად, იმის პროგნოზი, თუ კონკრეტულ პროდუქტზე სეზონის მიხედვით მოთხოვნა როგორ შეიცვლება. ზოგადად, მონაცემთა მეცნიერებას არც ისე დიდი ხნის ისტორია აქვს (ტერმინი Data Science-ი მხოლოდ 1974 წელს გაჟღერდა). შესაბამისად, აღნიშნული სფერო აქტიურად ვითარდება. სწორედ ამის გამო, მისი საზღვრები შეიძლება თავად სპეციალისტებისთვისაც ბუნდოვანი ჩანდეს. 

მონაცემთა მეცნიერად რომ ვიმუშავო, აუცილებლად ტექნიკური უნარები უნდა მქონდეს კარგად განვითარებული? არა და, ჰუმანიტარი ვარ. 

სულაც არა. დამწყებთათვის აკადემიური ცოდნა არც ისე მნიშვნელოვანია. მონაცემთა მეცნიერებას იმავე წარმატებით შეიძლება დაეუფლოს ფილოლოგი, ისევე როგორც ინჟინერ-მშენებელი. რა თქმა უნდა, ურიგო არ იქნება, თუ მათემატიკის ძირითადი კურსიდან ზოგიერთი თემა მაინც გემახსოვრებათ. თუ ეს ასე არ არის, არ მოიწყინოთ: პრაქტიკამ აჩვენა, რომ მონაცემთა მეცნიერებაში გარკვევა შეუძლიათ ტექნიკოსებსაც და ჰუმანიტარებსაც. ამავე დროს, ზოგჯერ სხვა ტიპის განათლება, რომელიც მათემატიკასა და პროგრამირებას საერთოდ არ უკავშირდება, შეიძლება ძალიან სასარგებლო აღმოჩნდეს. მაგალითად, ბიოლოგებს თავიანთი პროფესია დაეხმარება სამედიცინო პრობლემები უფრო სწრაფად გადაჭრან, ვიდრე მათ, ვინც Python-ის არსებობა უბრალოდ იცის. რა თქმა უნდა, მათემატიკისა და უცხო ენების ცოდნამ შეიძლება პროგრამირების სწავლის პროცესი გააადვილოს. თუმცა ბევრად უფრო მნიშვნელოვანია უნარი და სურვილი, მუდმივად ახალი რამ ისწავლოთ და მეცნიერებაში მიმდინარე სიახლეებს სისტემატურად თვალ-ყური ადევნოთ.

დღეს ყველას მონაცემთა მეცნიერება აინტერესებს. სანამ მე ამ სფეროში გავერკვევი, აღნიშნული მიმართულების სპეციალისტებზე მოთხოვნა აღარ იქნება.

არ იდარდოთ, მონაცემთა ანალიზის ბაზარი წლიდან წლამდე სტაბილურად იზრდება. ექსპერტების აზრით, მომავალ წელს ის, 2016 წელთან შედარებით, ორნახევარჯერ გაიზრდება. ცხადია, გაიზრდება ამ მიმართულების სპეციალისტებზე მოთხოვნაც.

დიდ მონაცემებზე მუშაობა მხოლოდ ინფორმაციული ტექნოლოგიების სფეროში გამოცდილების მქონე ადამიანებს შეუძლიათ! 

არა. IT სპეციალისტების გადამზადება ნამდვილად უფრო ადვილია, თუმცა მხოლოდ ზოგიერთებისთვის. მაგალითად, Python-თან მომუშავე ვებდეველოპერს ნამდვილად შეუძლია გაიგოს, თუ როგორ უნდა იმუშაოს დიდ მონაცემებზე უფრო სწრაფად (ერთ თვეში ან თუნდაც ერთ კვირაში). თუმცა ინფორმაციული ტექნოლოგიების სფეროში დასაქმებულ პროექტის მენეჯერს მონაცემებზე მუშაობის სწავლა ნულიდან მოუწევს. საშუალოდ, ამ სფეროში გასარკვევად, დამწყებს დაახლოებით ერთი ან ორი წელი დასჭირდება. თუმცა აქაც, ისევე როგორც სხვა ნებისმიერ უნართან მიმართებით, მოქმედებს უნივერსალური წესი: რაც მეტია პრაქტიკა, სწავლის პროცესიც უფრო სწრაფია.

დიდ მონაცემებზე მუშაობა მოსაწყენია. აქ მხოლოდ გრაფიკები და ციფრებით აჭრელებული ცხრილებია! 

სულაც არა. რა თქმა უნდა, მონაცემებზე მუშაობისას (როგორც ნებისმიერ სხვა საქმეში) არსებობს რუტინული ამოცანები და მოსაწყენი მომენტები, მაგრამ ზოგჯერ მონაცემთა ანალიტიკოსები დგებიან ისეთი ამოცანების წინაშე, რომლებიც აქამდე არავის გადაუჭრია. ამ შემთხვევაში, თქვენ არატრივიალურ მეთოდს უნდა მიაგნოთ და ერთგვარი პიონერი იყოთ. დავუშვათ, რომ გვაქვს მონაცემები სხვადასხვა სკოლის მოსწავლეების შესახებ. ჩვენ ვიცით, რა დროს ატარებენ ისინი ტრანსპორტში, გაკვეთილების გარდა რას საქმიანობენ, ოჯახში როგორი სიტუაცია აქვთ და სხვ. ამ მონაცემების საფუძველზე, მონაცემთა მეცნიერს შეუძლია წინასწარ განსაზღვროს, თუ რა შეფასებას მიიღებს კონკრეტული მოსწავლე ამა თუ იმ გამოცდაზე. კანონზმიერებას, რომელსაც რიგითი ობივატელი ყურადღებასაც კი არ აქცევს, Big Data სპეცილისტი სწორი დასკვნების გასაკეთებლად იყენებს.

მთელ დროს სწავლას ვერ დავუთმობ. თუ სამსახურთან შეთავსებას ვეცდები, არც ერთი გამომივა და არც მეორე! 

დიდ მონაცემებზე მუშაობა ისეთივე უნარია, როგორც პიანინოზე დაკვრა ან ფრენბურთის თამაში. შესაბამისად, მის ასათვისებლად არ არის საჭირო, მთელი დრო მხოლოდ ამ საქმეს დაუთმოთ.  თუმცა ისიც ფაქტია, რომ რაც მეტს ივარჯიშებთ, მით უფრო სწრაფად მიიღებთ სასურველ შედეგსაც.

სხვა თემები