Монгол Улс өөрийн биг дата сервертэй болох шаардлагатай

Автор | Zindaa.mn
2021 оны 05 сарын 18

Энэ оны дөрөвдүгээр сард ОХУ-д болсон Дата шинжилгээний олон улсын олимпиадад монгол залуус 15 орны 650 гаруй багтай өрсөлдөн тавдугаар байр эзэлсэн билээ. Дижитал зээлийн “Simple” аппликэйшний дата шинжээч Ч.Алтан-Өлзий, БНСУ-ын Чүнгбүкийн их сургуулийн докторант М.Лхагвадорж, “Миг” даатгалын дата шинжээч М.Чойсүрэн нараас бүрддэг “MN team 2” баг хоёр дахь жилдээ оролцжээ. Тэд гурвуулаа МУИС-ийн төгсөгчид бөгөөд Ч.Алтан-Өлзий, М.Лхагвадорж хоёр нэг ангийнх ажээ. Олимпиадын эхний шат нэг сарын турш үргэлжилдэг, тэндээс шалгарсан 30 баг сүүлийн шатанд орж, 36 цагийн турш даалгавар гүйцэтгэдэг юм байна. 

“MN team 2” багийн залуустай онлайнаар ярилцлаа.


М.Лхагвадорж: Тодорхой хүрээнд танигдсан тэмцээн л дээ. Дата шинжлэх ухаан өндөр хөгжсөн орнуудын багууд идэвхтэй оролцдог. Kaggle гээд датагийн тэмцээн зохион байгуулдаг хамгийн том платформын хамгийн өндөр цол нь “гранд мастер” гэж цол байдаг. Саяын олимпиадад эхний гурван байрт орсон нэг багт нь Kaggle-ын гранд мастер байсан нь энэ тэмцээний чанар чансааг харуулж байгаа болов уу. 

-Тэмцээнд оролцогчдод ямар даалгавар өгдөг вэ?

Ч.Алтан-Өлзий: -Тэмцээний эхний шатанд оролцогчдодоо дата өгдөг. Тоо, график, зураг, бичлэг... гээд ямар төрлийн ч дата байж болно. Түүн дээрээ үндэслэж, шийдэл олохыг даалгадаг.

М.Лхагвадорж: Ерөнхийдөө физикийн даалгавар өгдөг юм шиг санагдсан. Ноднин бид тойрог замд байгаа 624 хиймэл дагуулын байршлыг урьдчилан таамаглах байсан.  Нэгдүгээр байрт орсон багийн гүйцэтгэл 96 хувьтай таамагласан. Манайх 92 хувьтай таамагласан.  Энэ жил одны зураг өгөөд оддыг ангилж, энергийн түвшнийг нь тодорхойлох даалгавар өгсөн. Авч болох хамгийн дээд оноо нь 1000. Манайх 670 оноо аваад, дөрөвдүгээр байранд жагсаад, хоёрдугаар шат руугаа орсон. Хоёрдугаар шатанд энэ жилийн ивээн тэтгэгч ОХУ-ын “Открытый” банкны харилцагчдын датан дээр шинжилгээ хийх даалгавар өгсөн.

Ч.Алтан-Өлзий: Харилцагчид банкаар яаж үйлчлүүлсэн, картаа яаж ашиглаж, ямар гүйлгээ хийж байна гэх зэрэг бүх датаг харилцагч бүрээр өгөөд тэр датанаас нэгдүгээрт, аль харилцагчид зээлийн бүтээгдэхүүн санал болговол оновчтой байх загвар, хоёрдугаарт, тухайн банкны ашгийг яавал хамгийн их байлгах шийдлийг хайх ёстой байсан. Нийт датаны гуравны нэгийг нь тэмцээн дээр бидэнд нээлттэй өгдөг. Тэрхүү өгөгдөл дээр бид өөрсдийн боловсруулсан загварын гүйцэтгэлийг оноо, бусад багийн гүйцэтгэлийг ил харж болдог. Яг эцсийн шийдвэрийг гаргахдаа далд үлдсэн гуравны хоёр датан дээрээ үндэслэж байр эзлүүлдэг. Тэмцээний 36 цагийн турш тэргүүлж явсан манай баг тэр оноон дээрээ нэлээн буурсан. Сүүлд нь бид гурав алдаа оноогоо ярилцахад илгээсэн 50 гаруй шийдлийнхээ хамгийн сайныгаа өгөөгүй байна лээ. Хэрвээ бид хамгийн сайн шийдлээ зөв сонгосон бол гуравдугаар байрт орох боломжтой байсан. Загвараа сонгохдоо жижиг алдаа гаргасан маань бидэнд туршлага болоод үлдлээ.

-Түрүүлсэн багууд та нараас давуу ямар шийдэл гаргасан байна?

М.Лхагвадорж: Орос, Швейцар дата шинжээчдийн баг  түрүүлж, Францын баг удаалсан юм. Аргачлалын хувьд бидэнтэй ерөнхийдөө адилхан. Бидний боловсруулсан загварт нэг дутагдал байсан нь энэ хүн зээл авах уу үгүй юу гэдэг дээр голлон анхаарсан. Хэдийгээр тэр хүн зээл авсан ч гэсэн банкнаас гарч байгаа зардал, зээлээсээ өгч байгаа өгөөж хоёрын зөрүү маань эерэг байж л банк тухайн харилцагчаас ашиг хүртэнэ шүү дээ. Нэг, хоёрт орсон багуудын шийдлийг харахад зээл авсан ч банкиндаа ашигтай шийдлийг сонгосон учраас тэмцээний турш ил оноогоороо тэргүүлж байсан бидний дээр гараад ирсэн л дээ.

-Дата шинжилгээний “Гранд мастер” цолыг яаж авдаг вэ?

Ч.Алтан-Өлзий: Kaggle гээд Google-ийн суурьтай том платформ бий. Тэнд дата шинжээчид янз бүрийн тэмцээнд үргэлж оролцдог юм. Таван тэмцээнд амжилттай оролцоод алтан медаль авсан хүн “Гранд мастер” болдог. Одоо дэлхий дээр ийм цолтой 213 гаруй шинжээч бий. Хоёрт нь дата шинжилгээний суурь болсон дата буюу өгөгдлийг хэн илүү гоё боловсруулсан, хэн гоё сонирхолтой өгөгдөл нийтэд нээлттэй болгосноор  нь цол өгдөг. Гуравт нь, дата анализ хийж байгаа кодоо олон нийтэд нээлттэй тавьсан хүмүүсээс хамгийн гоё анализ хийсэн, сайн үр дүн гарсан кодууд дээр оноо өгөөд цол олгодог. Тэрийг “нөүтбүүк гранд мастер” гэдэг. Сүүлийн дөрөв дэх нь энэ асуудлыг энэ датан дээр яаж шийдвэл илүү үр ашигтай байх вэ гэсэн хэлэлцүүлгүүд өрнүүлээд, тухайн хэлэлцүүлгийн санаа, оноо дээр нь оноо өгөөд явчихдаг. Монголд одоохондоо гранд мастер байхгүй, нэг мастер, хэд хэдэн эксперт бий.

-Маш сонирхолтой байна. Ингэхэд та гурав яагаад дата шинжилгээнд дурлачихав аа?

М.Чойсүрэн: Миний хувьд 2016 онд МУИС-ийн эдийн засгийн мэдээлэл, загварчлалын ангийг төгссөн юм. Энэ ангид эдийн засгийн хичээлээс гадна мэдээллийн технологийн хичээл, Кодын СS+ гээд, өгөгдлийн сангийн Sequal гээд хэлүүдийг үздэг байсан юм. “Дата сайнс” буюу өгөгдлийн шинжлэх ухаан бол математик, статистик, програмчлал буюу компьютер технологи гэсэн гурван шинжлэх ухааны нийлмэл ухаан. Тиймээс миний хувьд хөрвөөд ажиллахад боломжтой байсан. Би өөрөө дунд сургуульд байхдаа математикийн олимпиадад ордог байсан, их сургуульд статистик, эдийн засаг, программын ойлголтуудыг авсан болохоор ийм хосолсон чиглэлээр ажиллавал илүү сонирхолтой, үр дүнтэй юм байна гэж бодоод орсон доо.

М.Лхагвадорж: Би их сургуулиа төгсчихөөд Худалдаа хөгжлийн банкинд дөрвөн жил ажилласан юм. Зээлийн багцын эрсдэл хариуцсан шинжээч байсан. Хүн зээл авах гээд ирэхэд бид түрүүлээд үнэлгээг нь зөв хийчихвэл эрсдэлээ бууруулах боломжтой. Нөгөө талаасаа ашгийн түвшин нэмэгдэнэ. Тэр талаар судлаад яваад байсан чинь ерөнхийдөө дата майнингийн аргачлал тэр асуудлыг сайн шийддэг нь тодорсон. Тэгээд ахынхаа тусламжтайгаар Чүнгбүкийн их сургуульд компьютерийн чиглэлээр сурч, магистр хамгаалсан. Тэр хоёр жилдээ өгөгдлийн шинжлэх ухаан, хиймэл оюун ухааны талаар нэлээн гүнзгий ойлголт авсан. Профессор маань намайг үргэлжлүүлээд докторт сурахыг санал болгоод. Тэгээд сурч байна.

Ч.Алтан- Өлзий: Би МУИС-аа төгсөөд Монголбанкны мөнгөний бодлогын газарт 6 жил ажилласан. Тэр үеэс л дататай ажиллаж эхэлсэн дээ. Миний үндсэн ажил бол инфляцийг таамаглах. Сүүлд нь дата шинжлэл, дата сайнс, машин сургалт, хиймэл оюуны салбарт өөрийгөө сорьж үзье гээд гурван жилийн өмнөөс хувийн хэвшилд ажиллаж байна. Тэр цагаас хойш одоо хүртэл дататай арай ойроос, жинхэнэ утгаар нь ажиллаж байна.

-Кодоо ямар хэлээр бичдэг вэ?

М.Лхагвадорж: Чойсүрэн маань програмчлалын хүн болохоор илүү олон хэл ашигладаг байх аа. Өлзий бид хоёрын хувьд...  Дата шинжилгээ хийхдээ хоёр үндсэн хэлийг ашигладаг. R программын хэл-ийг илүү статистик тал руугаа дата боловсруулж, мэдээлэл боловсруулахад түлхүү ашиглана. Нөгөөдөх нь Python. Хиймэл оюун ухаан тал руугаа өгөгдөл боловсруулахад, анализ хийхэд голчлон хэрэглэдэг.

-Та гурав нэг баг болсноос хойш хэдэн тэмцээнд ороод байна?

М.Лхагвадорж: Анх “ML UB club”-аас зохиосон тэмцээнд оролцож, Улаанбаатар хотын автобусны буудал болгон дээр хэдэн хүн суух, дараагийн автобус буудал дээр хэдэн цагт хүрч ирэхийг таамаглах тэмцээнд оролцож байсан. Тэгэхэд Чойсүрэн бид хоёр тэр тэмцээнд орж, Өлзий маань зохион байгуулж таарсан. Дараа нь Kaggle дээр янз бүрийн тэмцээнд орсон. “Wallmart”-ын дэлгүүрүүд өдөрт ямар бүтээгдэхүүн хэдэн ширхэг борлохыг таамаглах тэмцээн зарлахад Чойсүрэн бид хоёр нэг нэгээ мэдэхгүй тус тусдаа орж таарсан. Тэнд бид нэлээн амжилттай оролцсон боловч бидний медалийг өгөөгүй. Яагаад өгөөгүй шалтгааныг олоогүй.

М.Чойсүрэн: Тэрнээс хойш Лхагвадорж ах бид хоёр машины дугаарын зургаас ямар дугаартай машин болохыг нь таньдаг “ML UB club”-ын бас нэг тэмцээнд баг болж ороод, хоёрдугаар байр эзэлж байлаа.

М.Лхагвадорж: Алтан- Өлзий бид хоёр ноднин Монголбанкны эрдэм шинжилгээний хуралд багаар оролцоод түрүүлсэн. Бид Твиттерт хүмүүсийн хийсэн валютын ханшны талаарх жиргээнүүдийг 2012 оноос хойшхийг түүж аваад, энэ нь валютын ханштай ямар нөлөөлөлтэй байгааг судалсан. Дараагаар нь Алтан-Өлзий бид хоёр уул уурхайн хакатонд баг бүрдүүлж ороод хиймэл дагуулын зурагнаас уул уурхайн нөхөн сэргээлт хийлгүй орхиж, эвдэрсэн газрыг тодорхойлох систем боловсруулсан юм.

-Твиттерийн жиргээг өөрсдөө нэг бүрчлэн уншиж түүвэрлэсэн үү, эсвэл програмчлалын аргаар ялгасан уу?

М.Лхагвадорж: Twitter өнгөрсөн оны 12 дугаар сард api-гаа шинэчилсэн. Тэрнээс өмнө бол код бичээд өнгөрсөн хугацааны жиргээг үнэгүй татаад авчих боломжтой байсан. Одоо бол хамгийн ихдээ долоо хоногийнхыг татах боломжтой. Бас бага хэмжээний төлбөр төлөөд хүссэнээрээ өгөгдөл авч болно.

-Тэмцээндээ яаж бэлтгэдэг вэ?

М.Лхагвадорж: Тэмцээнээс тэмцээнд их зүйл сурдаг. Тэрнээс цаг гаргаж бэлтгэнэ гэсэн юм байхгүй. Би сүүлийн дөрвөн жил судалгааны ажил уншаад, онолын мэдлэг авсан хэрнээ яг практик талдаа ашигладаггүй байсан. Тэмцээнд орохоор энэ онол тийм сайн ажилладаггүй юм байна шүү, тэр онол тийм байна гэдгийг мэдээд авчихдаг. Тэмцээн болгон онцлогтой. Асуудлаасаа шалтгаалаад шийдэх шийдэл нь өөр. Сүүлд би Индонезийн онлайн худалдааны “Шоппи” гээд дэлгүүрийн тэмцээнд орлоо. Тэнд барааны зургийг оруулахад ижил төстэй бараануудыг гаргаж ирэх, бүлэглэх загвар хийж оролцсон. Иймэрхүү төрлийн тэмцээнд орж байгаагүй болохоор сурах зүйл ихтэй байлаа. 

-Жишээлбэл, боловсролын салбарт  хамгийн оновчтой, зөв шийдэл гаргая гэвэл шаардлагатай  чанартай дата цугларч чадах болов уу?

М.Лхагвадорж: Нэг үеэ бодоход манай төрийн байгууллагуудын датаны чанар сайжирсан. Хувийн хэвшлийн байгууллагууд ч ялгаагүй. Миний бодлоор, бид өөрийн гэсэн найдвартай нэгдсэн сервертэй болох хэрэгтэй. Мэдээллийн нууцлалаа бодсон ч тэрэн дээр төр өөрөө хөрөнгө оруулаад, чаддаг хүмүүсээр нь хийлгэмээр санагддаг. Одоо яамд өөрсдийн сервертэй байгаа ч нэгдсэн биш. Манайхан Хятадаас яамдын мэдээллийн баазыг ингэж хакердсан гээд байдаг. Хэрэв энэ үнэн бол бид гадаад паспортын мэдээлэлээ алдахад л ардаа аягүй том эрсдэлтэй шүү дээ.

-Одоо хийж байгаа ажлуудыг чинь сонирхъё...

М.Лхагвадорж: Одоо байгаа машин сургалтын загварууд нь болохоор маш сайн таамаглалын үр дүнг харуулдаг хэрнээ оролт, гаралтын хооронд хамаарлыг тайлбарлаж чаддаггүй моделиуд ерөнхийдөө хөгжсөн. Тэгвэл миний хувьд тайлбарлаж болдог хэрнээ маш сайн таамаглалын үр дүнг харуулж чаддаг загвар боловсруулах дээр ажиллаж байна.

М.Чойсүрэн: Миний хувьд “Миг” даатгал компани дээрээ дата мэдээлэлд дүн шинжилгээ хийж, удирдлагуудад мэдээллийг түргэн шуурхай хүргэх үүрэг гүйцэтгэдэг. BI буюу business intelligence гээд дата мэдээллийг түргэн шуурхай удирдлагуудад хүргэж, мэдээллийг түргэн шуурхай авснаар   удирдлагын шийдвэр гаргалт хурдасч, компанийн зардлыг хэмнэх ач холбогдолтой.

Ч.Алтан-Өлзий: Манай “Simple” аппликейшн дижитал зээлийн үйлчилгээ үзүүлдэг. Бид маш их шат дамжлагатай уламжлалт шатыг хялбарчлаад, зөвхөн аппликэйшнээр дамжуулж зээл олгохыг зорьж ажиллаж байгаа. Би тэнд Дата шинжилгээ, загвар хөгжүүлэлт хариуцсан багийг ахалж ажилладаг.

-Ойрын ирээдүйн төлөвлөгөөгөө хуваалцаач...

М.Лхагвадорж: Миний хувьд ирэх өвөл докторантураа төгсөнө. Тэгээд Америк юм уу Европын аль нэг улсад хоёр жил докторын дараах судалгааны ажил хийх боломжийг судална. Түүний дараа Монголдоо  очно гэсэн бодолтой байгаа. Гадаадын их сургуулиудыг харахаар профессорууд нь доороо лабораторитой, тэнд нь оюутнууд сурдаг, бизнесийн байгууллагууд төсөл захиалдаг тогтолцоотой. Ингэж бизнес нь шинжлэх ухаантайгаа холбогдоод, боловсролоо дэмжээд явдаг. Үр дүнд нь аль аль нь зэрэг хөгждөг. Манайд тийм систем байхгүй. Бизнесийн байгууллагууд юм хийлгэх болохоор дандаа гадагшаа хандаж, гаднаас экспертүүд авдаг. Тэгэхээр манай боловсролын систем нь төрөөс өөр ямар ч дэмжлэггүй болчихож байгаа юм. Би Монголдоо буцаж очоод лаборатори байгуулан, төсөл аваад явах, Монголынхоо одоогийн тогтолцоог өөрчлөхийг хүсдэг.

М.Чойсүрэн: Миний хувьд академик талын мэдлэгээ сайжруулж, ойрын 2-3 жилд гадаадын өндөр хөгжилтэй оронд магистрт сурах  төлөвлөгөөтэй байгаа.

-Ярилцлагын төгсгөлд уншигчдад маань хандаж юу хэлмээр байна?

Ч.Алтан-Өлзий: Өгөгдлийн шинжлэх ухаан хурдтай хөгжиж байна. Түүнээс хоцрохгүйгээр, байнга суралцаад өөрийгөө хөгжүүлэх сэн, сайжруулах сан гэж бодож байна. Цаашдаа өгөгдлийн шинжлэх ухаан хурдтай хөгжиж, бүх салбарт нэвтэрч байгаа болохоор бид  улам олуулаа л болох ёстой гэж боддог. Та ямар ч мэргэжлийн, аль ч салбарт ажилладаг бай өгөгдлийн шинжлэх ухааны тодорхой хэмжээний мэдлэгтэй болчихвол илүү давуу талтай болно. Миний оролцоотой  “ML (Machine Learning) UB” гээд ашгийн бус комюнити байдаг. Бид  илүү олон хүнд өгөгдлийн шинжлэх ухааны тухай ойлголтыг хүргэж, улам олон залуучуудыг энэ талбарт татаж, энэ салбарт ажиллаж байгаа шинжээч залуучууд мэдээлэл, туршлагаа хоорондоо солилцоосой гэж зорьж ажилладаг.

М.Лхагвадорж: Монголын мэдээллийн технологийн салбар дэлхийн түвшнээс нэлээдгүй хоцорсон байгаа. Хүссэн хүсээгүй тун ойрын ирээдүйд зарим ажлын байрыг датан дээр суурилаад хийчих аппликейшнүүд орлоод, хүн хэрэггүй болох нь. Ирээдүйн энэ сорилтод тэсэн үлдэхийн тулд бизнес, санхүүгийн чиглэлээсээ илүү инженерчлэл тал руугаа мэргэжил сонгоод явбал бидэнд өгөөжтэй болов уу. Салбар салбартаа, мэргэжил мэргэжлээрээ дата шинжилгээний чиглэл рүү ороосой, өөртөө давуу талыг бий болгоосой гэж хүсэж байна.

Эх сурвалж: ӨГЛӨӨНИЙ СОНИН

Сэтгэгдэл ( 0 )

Сэтгэгдэл бичихдээ хууль зүйн болон ёс суртахууны хэм хэмжээг хүндэтгэнэ үү. Хэм хэмжээг зөрчсөн сэтгэгдэлийг админ устгах эрхтэй.
Top