We Love Vietnamese Natural Language Processing developing

Demo Sentiment Analysis Vietnamese

Sentiment Analysis Vietnamese (SAV) là mô hình phân tích cảm xúc trong Tiếng Việt với 2 lớp cảm xúc là: tích cực (Positive) và tiêu cực (Negative). SAV dùng các kỹ thuật Word2Vector và mô hình deep learning Recurrent Neural Network (RNN), mà cụ thể là Long Short Term Memory(LSTM) networks.

Mô hình SAV cho độ chính xác 87% với các bình luận (comment) hay đánh giá (review) của người tiêu dùng về các sản phẩm dịch vụ, giải trí như: các quán ăn, nhà hàng, khách sạn, địa điểm du lịch, rạp chiếu phim, bộ phim, diễn viên, người mẫu, các thương hiệu nổi tiếng...

Read more...

Nhập một đoạn văn Tiếng Việt (Paragraph Vietnamese)
Kết quả (Result):

Demo VNTok

VNTok là công cụ tách từ Tiếng Việt. VNTok phát triển đựa trên mã nguồn mở của Lê Hồng Phương, download source code tại đây.

VNTok cho độ chính xác khoảng 96% - 98%.

Read more...

Nhập một đoạn văn Tiếng Việt (Paragraph Vietnamese)
Kết quả (Result):

Demo Word2Vector Vietnamese (VNW2V)

VNW2V là một mô hình ngôn ngữ Word2Vector của Tiếng Việt. Kích thước bộ từ vựng là 74.268 từ (words), số chiều vector mỗi word là 300. Được tạo bằng tool Gensim. Bạn có thể download VNW2V bản build dạng binary tại đây, khoảng 90MB.

Word2Vector in Literature: It's like numbers are language, like all the letters in the language are turned into numbers, and so it's something that everyone understands the same way. You lose the sounds of the letters and whether they click or pop or touch the palate, or go ooh or aah, and anything that can be misread or con you with its music or the pictures it puts in your mind, all of that is gone, along with the accent, and you have a new understanding entirely, a language of numbers, and everything becomes as clear to everyone as the writing on the wall. So as I say there comes a certain time for the reading of the numbers.

-- E.L. Doctorow, Billy Bathgate --

Read more...

 

Độ tương đồng giữa 2 từ (similarity 2 words)
Kết quả (Result):

Similarity 2 words:
Lấy những từ gần nhất (top words nearest)

Kết quả (Result):

Words Nearest:
Logic mở rộng (logical extension)
Kết quả (Result):

Nếu
Thì
......

Works

Sentiment Analysis Vietnamese

Read more...

Sentiment Analysis Vietnamese

Sentiment Analysis Vietnamese (SAV) là mô hình phân tích cảm xúc trong Tiếng Việt với 2 lớp cảm xúc là: tích cực (Positive) và tiêu cực (Negative).

SAV dùng các kỹ thuật Word2Vector và mô hình deep learning Recurrent Neural Network (RNN), mà cụ thể là Long Short Term Memory(LSTM) networks.

Mô hình SAV cho độ chính xác 87%.

Read more...

VNTok: Công cụ tách từ Tiếng Việt

Read more...

VNTok

VNTok là công cụ tách từ Tiếng Việt. VNTok phát triển đựa trên mã nguồn mở của Lê Hồng Phương, download source code tại đây.

VNTok cho độ chính xác khoảng 96% - 98%.

Read more...

VNW2V: Word2Vector của Tiếng Việt

Read more...

VNW2V

VNW2V là một mô hình ngôn ngữ Word2Vector của Tiếng Việt. Kích thước bộ từ vựng là 74.268 từ (words), số chiều vector mỗi word là 300. Được tạo bằng tool Gensim. Bạn có thể download VNW2V bản build dạng binary tại đây, khoảng 90MB.

Read more...

Dataset Sentiment Analysis Vietnamese

Read more...

Dataset Sentiment Analysis Vietnamese

Trong bài viết này chúng tôi công bố một số tài nguyên được dùng trong các bài viết trước, về chủ đề phân tích cảm xúc trong văn bản Tiếng Việt.

  1. Tại sao việc chạy thực nghiệm hay thí nghiệm một bài toán liên quan đến deep learning là khó với người nghiên cứu?
  2. Bộ dữ liệu Tiếng Việt tách từ.
  3. Bộ dữ liệu nhận xét (review) được gán nhãn cảm xúc tích cực, tiêu cực.

Read more...

Tips and tricks for training neural networks

Read more...

Tips and tricks for training neural networks

Bài viết này sẽ đề cập đến một số mẹo và thủ thuật cần lưu tâm về huấn luyện mô hình mạng nơron. Được Andrej Karpathy tổng kết lại trong quá trình giải quyết các bài toán dùng mạng nơron trong các dự án thực tế mà anh ta làm việc. Andrej Karpathy hiện đang là giám đốc trí tuệ nhân tạo tại Tesla (Director of Artificial Intelligence at Tesla). Chúng ta sẽ học hỏi được một quy trình đúng để huấn luyện mạng nơron sao cho kết quả tốt nhất. Các bạn cùng tham khảo.

Read more...

Our Team

Product

Loopi
A Product of NTC Solutions

Loopi: Ứng dụng học Tiếng Anh giao tiếp thường đàm thực dụng miễn phí.

           

DoSan
A Product of NTC Solutions

DoSan: Ứng dụng học Tiếng Hàn giao tiếp thường đàm thực dụng miễn phí.

           

KaMeZoKo
A Product of NTC Solutions

KaMeZoKo: Ứng dụng học Tiếng Nhật giao tiếp thường đàm thực dụng miễn phí.