Đại học Quốc Gia Hà Nội

Cựu sinh viên đạt giải Nhất lĩnh vực công nghệ thông tin tại Giải thưởng Nhân tài Đất Việt 2016

Send to friendPDF version
Sau bốn năm đầu tư và phát triển, dự án "Hệ thống phân tích ngữ nghĩa và quản trị tương tác mạng xã hội SMCC" của Công ty cổ phần Chọn lọc thông tin (InfoRe) của cựu sinh viên Trường Đại học Công nghệ (ĐHCN) đã nhận Giải Nhất Công nghệ thông tin (CNTT) triển vọng tại Nhân tài Đất Việt năm 2016. Anh Nguyễn Việt Cường vừa là cựu sinh viên, hiện nay là giảng viên kiêm nhiệm Trường ĐHCN đã có những chia sẻ về khoảng thời gian nghiên cứu và phát triển dự án.
Giải thưởng này có ý nghĩa và động lực ra sao đối với nhóm nghiên cứu sản phẩm của InfoRe nói riêng và những nhóm nghiên cứu nói chung?
Các thành viên đã tham gia nghiên cứu sản phẩm và cũng là đồng sáng lập công ty gồm Nguyễn Việt Cường (cựu sinh viên, giảng viên kiêm nhiệm Trường ĐHCN); Đinh Hoàng Phương (Cựu sinh viên, World Bank Vietnam và Google Inc); Lê Viết Hà (Cựu sinh viên, MediaMax Japan Vietnam); Lê Công Thành (Giám đốc Công ty InfoRe); Nguyễn Doãn Tùng (Trường Đại học Hà Nội); Nguyễn Mạnh Hùng (Công ty InfoRe).
Đối với bản thân nhóm nghiên cứu ở InfoRe thì giải thưởng này là sự công nhận bước đầu của một hội đồng chuyên môn gồm những chuyên gia hàng đầu đối với những nỗ lực của nhóm trong việc áp dụng các kiến thức hàn lâm mới nhất của thế giới vào một sản phẩm thực tế phục vụ nhu cầu của người dùng nói chung và đặc biệt là người dùng ở Việt Nam. Đây là một sự cổ vũ lớn đối với nhóm trong những bước hoàn thiện và nâng cấp tiếp theo của sản phẩm này cũng như những sản phẩm khác mà InfoRe đang thực hiện.
Với những nhà nghiên cứu trẻ và nhóm nghiên cứu khác, chúng tôi nghĩ rằng giải thưởng này sẽ giúp khích lệ các bạn mạnh dạn tìm kiếm những hướng ứng dụng các công nghệ mới nhất của thế giới để phục vụ thị trường Việt Nam nhằm nâng tầm công nghệ sản xuất cũng như trải nghiệm của người dùng.
 
Nhóm nghiên cứu dự án "Hệ thống phân tích ngữ nghĩa và quản trị tương tác mạng xã hội SMCC"
 
Thưa anh, vậy ý tưởng ban đầu thực hiện sản phẩm của nhóm xuất phát từ đâu?
Ban đầu, trong quá trình học tại trường, đa phần kiến thức của chúng tôi mang nặng tính hàn lâm. Các ứng dụng nghĩ ra hầu như giống như những gì được viết trên các bài báo khoa học hoặc tạp chí. Tuy nhiên, những gì chúng tôi học được tại trường đã có ý nghĩa rất lớn trong việc xây dựng thành phần lõi của hệ thống SMCC sau này, bao gồm công nghệ máy tìm kiếm tốc độ cao và công nghệ xử lí ngôn ngữ tự nhiên. Ngay sau khi có ý tưởng, chúng tôi là một nhóm bạn lớn lên cùng nhau và chơi với nhau cũng đã lâu với hầu hết thành viên đều sinh năm 1983, tương ứng với K46 của ĐHQGHN. Cuối năm 2011, đầu năm 2012, sau khi Lê Công Thành về Việt Nam và đúng thời điểm đó, tôi đã hoàn thành chương trình đào tạo tiến sĩ về lĩnh vực xử lí ngôn ngữ tự nhiên. Ngay lập tức, chúng tôi bàn bạc và quyết định phải làm một sản phẩm để ứng dụng được những điều đã học nhằm phục vụ thị trường Việt Nam. Và bắt đầu bước chân vào thị trường kinh doanh. Chúng tôi kêu gọi những người bạn khác và cùng nhau lập ra InfoRe. Chúng tôi đi từ những sản phẩm hết sức sơ khai nhưng có ứng dụng học máy (machine learning) như tự động sinh văn bản phục vụ tối ưu máy tìm kiếm (SEO) rồi đến ứng dụng công nghệ máy tìm kiếm và phân tích ngữ nghĩa để quản trị danh tiếng trên mạng (ORM). Và như một sự phát triển tự nhiên khi mạng xã hội bùng nổ ở Việt Nam, chúng tôi nâng tầm ORM lên thành SMCC với khả năng quản trị tương tác mạng xã hội. Các ý tưởng về sản phẩm đa phần đến từ việc tương tác với khách hàng và tìm hiểu những xu hướng mới nhất trên thế giới. Vì vậy, SMCC là hệ thống phân tích thống kê thông tin trên mạng xã hội có đầy đủ chức năng của một hệ thống phần mềm dịch vụ SaaS (Software as a Service), hệ thống sử dụng các kỹ thuật Deep Learning tiên tiến để xử lý văn bản tiếng Việt.
 
Vậy dự án sẽ hoạt động như thế nào?
Hệ thống này sẽ quét những thông tin được xuất bản hàng ngày trên Internet tại Việt Nam như thông tin trên mạng xã hội, thông tin báo chí xuất bản, thông tin trao đổi trên các diễn đàn hoặc các blog nổi tiếng, đặc biệt là khoảng 95% lượng thông tin trên facebook. Sau khi quét thông tin, hệ thống dùng những bộ trí tuệ nhân tạo để cho máy tính tự phân tích nội dung, hiểu ngữ nghĩa nội dùng, qua đó tổng hợp thống kê và đưa ra các báo cáo theo yêu cầu. Từ đó, có thể giúp phát hiện sớm những rủi ro khủng hoảng, hay những thông tin phản ánh từ khách hàng để chăm sóc kịp thời, đo lường hiệu quả của những chiến dịch truyền thông, hay đơn giản là phân tích sở thích để thấu hiểu nhu cầu của khách hàng.
Hiện nay, trên thị trường hiện tại có một vài sản phẩm mà xét về mặt đặc điểm chung là khá tương đồng với chúng tôi và đôi khi có sự cạnh tranh trong kinh doanh. Tuy nhiên, sản phẩm của chúng tôi có những đặc điểm nổi trội mà các sản phẩm khác hiện tại chưa đạt được, có thể kể đến là Hệ thống phân tích ngữ nghĩa dựa trên những thuật toán trí tuệ nhân tạo khó và những kĩ thuật mới nhất như deep learning.
 
Nhóm nghiên cứu nhận giải Nhất tại lễ trao giải thưởng Nhân tài Đất Việt 2016
 
Khi dự án này hoàn thành, nó đã mang lại ý nghĩa như thế nào đối với khoa học và thực tiễn đời sống?
Đối với khoa học, sản phẩm này là một trong những ứng dụng thực tế của những kĩ thuật mới nhất trong nghiên cứu. Chúng tôi sẽ đưa ra những phản hồi đối với các nhà nghiên cứu về những vấn đề thực tế gặp phải khi triển khai và đòi hỏi những cải tiến cụ thể trong thuật toán hoặc mô hình học máy (machine learning) để giải quyết những vấn đề đó. Đó sẽ là cơ sở của những đề tài nghiên cứu mới.
Đối với thực tiễn đời sống, sản phẩm này hiện tại phục vụ các cá nhân, tổ chức có nhu cầu quản trị thông tin trên mạng xã hội liên quan đến những vấn đề mà họ quan tâm. Ví dụ như xem có thông tin xấu về cá nhân hay tổ chức không, phản hồi của người dùng mạng xã hội với một sản phẩm hoặc dịch vụ như thế nào, phát hiện người quan tâm đến sản phẩm dịch vụ và chăm sóc trực tiếp, tuỳ biến tới từng cá nhân, v.v… và rất nhiều ứng dụng thú vị khác.
Do vậy, sản phẩm đã được triển khai ở một số doanh nghiệp lớn và đang được rất nhiều doanh nghiệp cũng như cá nhân dùng thử.
 
Theo ý kiến của anh thì hoạt động ươm tạo, khởi nghiệp có ý nghĩa như thế nào đối với sinh viên?
Trong quá trình nghiên cứu và phát triển dự án, chúng tôi đã tham gia một số seminar khoa học của các nhóm nghiên cứu trong trường, như nhóm của thầy Hà Quang Thuỵ. Ngoài ra, chúng tôi cũng tham gia trình bày và trao đổi kinh nghiệm ở các workshop liên quan do các đơn vị trong trường tổ chức ở ACML hay RIVF vừa qua, và tham gia giảng dạy ở "Trường hè Khai phá dữ liệu 2016" do Khoa CNTT tổ chức.
Vì vậy, chúng tôi cho rằng việc Nhà trường khởi động chương trình ươm tạo và khởi nghiệp cho sinh viên trong trường là một hoạt động hết sức có ý nghĩa. Việc đó sẽ tạo động lực lớn cho việc ứng dụng các nghiên cứu bậc cao, những thành tựu mới nhất của thế giới cho nền kinh tế Việt Nam. Gần đây, Nhà nước cũng nhắc đến việc đẩy mạnh nền kinh tế với những doanh nghiệp vừa và nhỏ, và chúng tôi nghĩ ra đây chính là những môi trường khởi nguồn tốt cho những doanh nghiệp vừa và nhỏ, nhưng có khả năng tiến ra thị trường khu vực và thế giới.
Bởi vì theo quan điểm phát triển, nghiên cứu sản phẩm khoa học công nghệ, trước hết phải dựa trên nhu cầu thực tế hoặc dự báo nhu cầu thực tế một cách có khoa học. Ngoài ra, riêng đối với InfoRe, chúng tôi chỉ tập trung nghiên cứu và phát triển những sản phẩm nào đòi hỏi hàm lượng chất xám cao, cần có sự hợp tác của những nhà nghiên cứu để thúc đẩy sự tiến bộ của xã hội và nâng tầm trí tuệ Việt.
Tuyết Nga (UET-News)