Google Prediction API: một hộp đen Máy học cho developer


API là gì?

API là viết tắt của Application Programming Interface (giao diện lập trình ứng dụng). Nó là 1 giao tiếp phần mềm được dùng bởi các ứng dụng khác nhau. Cũng giống như bàn phím là một thiết bị giao tiếp giữa ngườI dùng và máy tính, API là 1 giao tiếp phần mếm chẳng hạn như giữa chương trình và hệ điều hành (HĐH).
Một trong các mục đích chính của một API là cung cấp khả năng truy xuất đến một tập các hàm hay dùng — ví dụ, hàm để vẽ các cửa sổ hay các icon trên màn hình. Các API, cũng như hầu hết các interfaces, là trừu tượng (abstract). Phần mềm mà muốn cung cấp truy xuất đến chính nó thông qua các API cho sẵn, phải hiện thực API đó.
Google Prediction API cung cấp một giao diện RESTful để xây dựng mô hình máy học.
(RESTful API là một API sử dụng HTTP request để GET, PUT, POST và DELETE dữ liệu).

Google Prediction API được phát hành trở lại vào năm 2011, cung cấp một cách ổn định và đơn giản để train mô hình máy học thông qua giao diện RESTful, mặc dù nó dường như kém thân thiện hơn nếu bạn thường sử dụng giao diện trình duyệt web.

Google Prediction API: Machine Learning Black Box

Chúng ta có thể xác định cách tiếp cận của Google như một "hộp đen", kể từ khi bạn nhận ra rằng không thể kiểm soát những gì đang xảy ra bên trong: bạn gặp khó khăn khi phải xác định xem mô hình này là phân lớp (classification) hay hồi quy (regression), hay việc cung cấp một file tiền xử lý PMML (Predictive Model Markup Language) và tập hợp các weighting parameters trong trường hợp các mô hình phân loại.

Hãy cùng làm rõ một số khái niệm cơ bản sẽ giúp bạn hiểu cụ thể Google Prediction API:

  • Bạn cần Regression bất cứ khi nào output mục tiêu của bạn là một biến số liên tục có thể có hoặc không span trên một phạm vi cụ thể( ví dụ như giá của một chiếc ô tô, tuổi của một người, ...) 
  • Classification là những gì bạn cần bất cứ khi nào output mục tiêu của bạn có thể chỉ là một tập giá trị bị giới hạn, thậm chí cả số hoặc string, tùy thuộc vào điều kiện áp dụng của bạn. 
  • Binary Classification là một trường hợp đặc biệt khi output mục tiêu chỉ nhận 2 giá trị(True hoặc Falses), tuy mô hình đơn giản hơn nhưng chính xác hơn có thể xây dựng được. Trong một số trường hợp, việc xây dựng một tập mô hình nhị phân và kết hợp output của chúng có thể thực hiện tốt hơn một mô hình single multi-class.
Tin tốt là Google không áp đặt bất kỳ ràng buộc tùy ý trên các kiểu dữ liệu input của bạn hoặc yêu cầu bất kỳ quá trình cấu hình. Tất cả bạn cần làm là định dạng dữ liệu của bạn đúng cách. Hãy nghĩ về nó như một bảng lớn, trong đó mỗi hàng là một vector đầu vào và cột đầu tiên là giá trị mục tiêu của bạn.

(continue)

Bài viết dịch từ: http://cloudacademy.com/blog/google-prediction-api/

Comments

Popular posts from this blog

Reflection: Scope Variables

Những lợi ích của việc dùng email edu cho developer

Reflection: Pointer