검토 : Google Cloud AutoML은 진정으로 자동화 된 머신 러닝입니다.

데이터에 가장 적합한 머신 러닝 모델을 자동으로 학습 시키려고 할 때 AutoML 또는 자동화 된 머신 러닝이 있고 Google Cloud AutoML이 있습니다. Google Cloud AutoML은 위의 컷입니다. 

과거에는 H2O Driverless AI, Amazon SageMaker 및 Azure Machine Learning AutoML을 검토했습니다. 무인 AI는 자동으로 기능 엔지니어링 및 하이퍼 파라미터 튜닝을 수행하고 Kaggle 마스터와 마찬가지로 수행한다고 주장합니다. Amazon SageMaker는 하이퍼 파라미터 최적화를 지원합니다. Azure Machine Learning AutoML은 기본 기계 학습 알고리즘을위한 기능, 알고리즘 및 하이퍼 파라미터를 자동으로 스윕합니다. 별도의 Azure Machine Learning 초 매개 변수 조정 기능을 사용하면 기존 실험에 대한 특정 초 매개 변수를 스윕 할 수 있습니다.

이것들은 좋지만 Google Cloud AutoML은 완전히 다른 수준으로 이동하여 Google의 검증 된 고정밀 심층 신경망을 태그 된 데이터에 맞게 맞춤 설정합니다. Google Cloud AutoML은 데이터에서 모델을 학습 할 때 처음부터 시작하지 않고 자동 딥 전송 학습 (다른 데이터에 대해 학습 된 기존 심층 신경망에서 시작 함을 의미) 및 신경 아키텍처 검색 (추가 데이터의 올바른 조합을 찾는 것을 의미 함)을 구현합니다. 언어 쌍 번역, 자연어 분류 및 이미지 분류를위한 네트워크 계층).

각 영역에서 Google은 이미 심층 신경망과 레이블이 지정된 방대한 데이터 세트를 기반으로 한 사전 훈련 된 서비스를 하나 이상 보유하고 있습니다. 이것은 수정되지 않은 데이터에 대해 잘 작동 할 수 있으며 시간과 비용을 절약하기 위해 테스트해야합니다. 이러한 서비스가 필요한 작업을 수행하지 않는 경우 Google Cloud AutoML을 사용하면 전이 학습을 수행하는 방법이나 신경망을 만드는 방법을 알 필요없이 수행하는 모델을 만들 수 있습니다.

전이 학습은 신경망을 처음부터 훈련하는 것보다 두 가지 큰 이점을 제공합니다. 첫째, 대부분의 네트워크 계층이 이미 잘 훈련 되었기 때문에 훈련에 필요한 데이터가 훨씬 적습니다. 둘째, 최종 레이어 만 최적화하기 때문에 훨씬 빠르게 실행됩니다.

Google Cloud AutoML 번역

예를 들어 Google Cloud AutoML Translation 전이 학습을 사용하면 1 ~ 2 시간 내에 1,000 개의 2 개 언어 문장 쌍에 대해 학습 할 수 있습니다. 맞춤화 된 기본 신경망 인 NMT는 수많은 CPU와 GPU에서 각 언어 쌍에 대해 처음부터 학습하는 데 수백에서 수천 시간이 걸렸습니다. 사용자 지정 번역 모델 학습에 대한 시간당 요금은 현재 $ 76입니다.

AutoML Translation 초보자 가이드에서는 Google Cloud AutoML Translation이 수행 할 수있는 작업의 기본 사항과이를 사용하는 이유를 설명합니다. 기본적으로 틈새 목적을 위해 기존의 일반 번역 모델을 개선합니다. Google이 이미 지원하는 수백 개 정도의 언어에 대한 일반 번역을 위한 교육을 할 필요는 없지만 전문 어휘 또는 사용을 위한 번역 네트워크를 만들려면 전이 학습을 실행해야 합니다. Google이 언급하는 한 가지 예는 시간에 민감한 재무 문서를 실시간으로 번역하는 것입니다. 범용 번역은 항상 금융에 올바른 예술 용어를 사용하지는 않습니다.

 Google Cloud AutoML Translation에 대한 학습 설정은 문장 쌍이있는 파일을 준비한 후 아래 스크린 샷과 같이 5 단계 프로세스입니다. 탭으로 구분 된 값 파일로 형식이 지정된 AutoML Translation 빠른 시작에서 Google에서 제공하는 앱 프롬프트에 8,720 개의 영어-스페인어 쌍을 사용했습니다. Google Cloud AutoML Translation은 문장 쌍에 대한 XML 기반 TMX (번역 메모리 교환) 형식도 지원합니다.

학습을 수행하는 데 사용되는 하드웨어 (CPU, GPU, TPU, 메모리)를 제어 할 수있는 옵션이 없습니다. 그것은 의도적 인 것입니다. 교육은 필요한 것을 사용할 것입니다. 모델에 추가되는 신경망 계층, 실행할 Epoch 수 또는 중지 기준을 제어하는 ​​옵션도 없습니다.

모델 학습이 완료되면 기본 모델에 대한 BLEU 점수의 개선 사항 (모든 것이 잘 진행되는 경우)을보고 모델로 예측을 시도 할 수 있습니다. 이 교육은 0.9 시간 (예상보다 적음)이 걸렸고 비용은 68.34 달러였습니다.

Google Cloud AutoML Natural Language

Google Natural Language API는 텍스트를 가져 와서 사전 정의 된 목록에서 엔티티, 감정, 구문 및 카테고리를 예측합니다. 텍스트 분류 문제가 이러한 문제에 맞지 않는 경우 라벨이 지정된 문 집합을 제공하고 Google Cloud AutoML Natural Language를 사용하여 커스텀 분류자를 만들 수 있습니다.

학습을 위해 AutoML Natural Language를 설정하려면 데이터를 소싱하고 라벨을 지정하고 CSV 파일로 준비하고 학습을 실행해야합니다. 원하는 경우 AutoML Natural Language UI를 사용하여 데이터를 업로드하고 라벨을 지정할 수도 있습니다.

모델 학습이 완료되면 모델의 정밀도, 재현율 및 혼동 행렬을 볼 수 있습니다. 원하는 정밀도 / 재현율 트레이드 오프에 대한 점수 임계 값을 조정할 수도 있습니다. 위음성을 최소화하려면 재현율을 최적화하십시오. 오탐을 최소화하려면 정밀도를 최적화하십시오.

이 훈련은 3.63 시간 (예상대로)이 걸렸고 비용은 $ 10.88입니다.

Google Cloud AutoML Vision

Google Cloud Vision API는 이미지를 사전 정의 된 수천 개의 카테고리로 분류하고 이미지 내에서 개별 개체와 얼굴을 감지하며 이미지에 포함 된 인쇄 된 단어를 찾아 읽습니다. Google Cloud AutoML Vision을 사용하면 고유 한 카테고리 목록을 정의하고 학습시킬 수 있습니다. 일부 실제 애플리케이션에는 드론 사진에서 풍력 터빈의 손상을 감지하고 폐기물 관리를위한 재활용품 분류가 포함됩니다.

Google Cloud AutoML Vision 데이터 세트를 설정하려면 각 카테고리에 대해 최소 100 개의 이미지를 소싱하고 CSV 파일에 라벨을 지정해야합니다. 모든 이미지와 CSV 파일은 Google Cloud Storage 버킷에 있어야합니다.

이 교육은 최대 한 시간 동안 실행되도록 설정했으며, 이는 한 달에 최대 10 개의 모델에 대해 무료입니다. 나는 무료 훈련의 좋은 결과를보고 즐겁게 놀랐고, 정확성과 회상 력을 향상시키기 위해 훈련을 계속하지 않았습니다.

Google Cloud AutoML은 대상 번역, 맞춤 텍스트 분류, 맞춤 이미지 분류를 수행하기위한 편리한 옵션을 제공합니다. 이러한 각 API는 정확하게 레이블이 지정된 데이터를 충분히 제공하면 잘 작동하고 자체 신경망 모델 또는 자체 전이 학습 모델을 구축하는 것보다 훨씬 적은 시간과 기술이 소요됩니다. Google Cloud AutoML을 사용하면 TensorFlow, Python, 신경망 아키텍처 또는 학습 하드웨어에 대해 알 필요없이 실제로 TensorFlow 모델을 만들 수 있습니다.

데이터 준비를 잘못하는 방법은 여러 가지가 있지만 다행스럽게도 세 가지 API는 모든 범주에 대한 예제가 너무 적거나 너무 많은 등 가장 일반적인 오류를 확인합니다. 학습 후 표시되는 진단을 통해 모델이 얼마나 잘 작동하는지 알 수 있으며 레이블이 지정된 학습 데이터를 더 추가하고 학습을 다시 실행하여 모델을 쉽게 조정할 수 있습니다.

비용 : Google Cloud AutoML Translation : 학습 비용은 시간당 $ 76.00, 번역 비용은 처음 500,000 자 이후에는 백만 자당 $ 80입니다. Google Cloud AutoML Natural Language : 학습 비용은 시간당 $ 3.00, 분류는 처음 30K 이후 텍스트 레코드 1,000 개당 $ 5입니다. Google Cloud AutoML Vision : 학습 비용은 처음 1 시간 후 시간당 $ 20, 분류는 처음 1,000 개 이후 이미지 1,000 개당 $ 3입니다. 

플랫폼 : Google Cloud Platform