Ev > Haberler > Çin Haber  > Alfa köpek evrimi: kendi çalışma 3 gün 100:0 Rolling li Shishi versiyonu eski köpek
Haberler
Çin Haber
Şirket Haberleri
Sektörel Haberler
Ürün Bilgi
Önceki Fuarı
global news
Sertifikalar
Bizimle iletişime geçin
ÇİN Topwin SANAYİ A.Ş.., LTD. tutum 2002 yılında kurulmuştur "yenilik ve ilerleme için Çalışma. Ürünler mutluluk ve heyecan içindir" biz... Şimdi başvurun

Haberler

Alfa köpek evrimi: kendi çalışma 3 gün 100:0 Rolling li Shishi versiyonu eski köpek

chinatopwin chinatopwin 2017-10-19 09:55:03
Londra yerel saati üzerinde 18:00 de 18 Ekim (Beijing Time 19 01:00), AlphaGo tekrar dünyanın en iyi bilimsel Dergisi doğa. "
Bir yıldan fazla bir süre önce, AlphaGo bir kapak makalesi olan 28 Ocak 2016, deepmind ağır bir kağıt yayınladı, bu yendi Avrupa Şampiyonası Satranç fan Hui yapay zeka programı tanıttı.
Mayıs ayında bu yıl, 3:0 skoru Çinli oyuncu kırmızı kazanmak için, AlphaGo onun emeklilik duyurdu, ama DeepMind araştırma hızını durdurmadı. Londra yerel saati 18 Ekim 'de, DeepMind ekibi AlphaGo en güçlü sürümünü açıkladı, AlphaGo Zero kod adını. benzersiz hileler, "Self-öğretti". Ayrıca, beyaz bir kağıt başında, sıfır tabanlı öğrenme, sadece 3 gün içinde, üst Master olma.
Takım, AlphaGo sıfırdan önce AlphaGo 'ın tüm sürümlerinin seviyesini aştığını söyledi. Güney Koreli oyunculara karşı kazandım li Shishi 's sürümü AlphaGo, AlphaGo Zero 100:0 ezici başarı elde etti. DeepMind ekibi, 18 Ekim 'de yayınlanan bir kağıt şeklinde AlphaGo sıfır üzerinde araştırma yapacak.
"iki yıl içinde AlphaGo inanılmaz elde. Şimdi, AlphaGo Zero bizim en güçlü sürümüdür, bir sürü yükseltir. Hesaplama verimliliğini artırmak için sıfır ve insan satranç herhangi bir veri kullanmak için değil, "AlphaGo, DeepMind co-kurucusu ve CEO 'su doğan ha şahins (Demi Hassabis) dedi," sonunda, biz bu atılım algoritması kullanmak istiyorum, gerçek dünya çözmeye yardımcı olmak için sorunlar acil, gibi protein katlama veya tasarım yeni malzemeler. Eğer biz AlphaGo, bu konularda ilerleme yapabilir, bu yaşam anlayışını teşvik potansiyeli vardır, ve olumlu bir şekilde hayatımızı etkileyen "
Artık insan bilgisi ile sınırlı, sadece 4 TPU

AlphaGo önceki sürümü, milyonlarca insan uzmanları ile satranç gitmek ve kendi eğitim öğrenme denetimini güçlendirmek.
Go profesyonel oyuncu yenmeden önce, bu eğitim ay boyunca, birden fazla makine ve 48 TPU güvenerek (Google yongaları derin nöral ağ Computing hızlandırmak için tasarlanmış) gitti
AlphaGo Zero Bu temelde nitel bir gelişmedir. En büyük fark, artık insan verileri için gerekli olmasıdır. Demek ki, insan satrancı ile temas yok. Ar-Ge ekibi sadece Board satranç oynamak için serbest bırakın ve sonra kendini oyun. Bu AlphaGo Zero bir "düşük karbon", bir makine ve 4 TPU kullanmak için, büyük ölçüde kaynakları kaydeder söz değer.
AlphaGo Zero güçlendirme öğrenme altında Self Play satranç
Eğitim birkaç gün sonra, AlphaGo Zero neredeyse 5.000.000 disk Self oyunu tamamlanmış, insan ötesine gidebilirsiniz ve AlphaGo. DeepMind ekibinin tüm önceki sürümleri yendi, resmi blog üzerinde, güncellenmiş nöral ağ ve arama algoritmaları ile yeniden birleştirici sıfır, eğitim derinleştirir, sistem performansını biraz kendini ilerleme. Oyun sonuçları daha iyi ve daha iyi alıyorsanız, aynı zamanda, nöral ağ daha doğrudur.
AlphaGo Zero tarafından bilgi edinme işlemi
"Bu teknik detayların önceki sürümünden daha güçlü olmasının nedeni, artık insan bilgisinin sınırları yok, en yüksek oyuncuların sahaya AlphaGo öğrenebilir." AlphaGo takım lideri David Silva (Dave şerit) dedi.
David Silva girişine göre, AlphaGo Zero yeni takviye öğrenme yöntemi kullanır, kendini öğretmen haline Let. Bile ne bir sistem gitmek için, sadece tek bir nöral ağ, sinir ağı arama algoritması güçlü, kendini satranç oynuyor bilmiyorum.
Self oyun artışı ile, sinirsel ağ kademeli olarak ayarlanır, sonraki adımın öngörü yeteneğini artırmak ve sonuçta oyunu kazanmak. Daha güçlü, derinlemesine eğitim ile, DeepMind ekibi AlphaGo Zero da bağımsız olarak oyunun kurallarını keşfetti ve yeni strateji, bu antik satranç yuvarlak oyunu yeni anlayışlar getirmek bulundu.
Kendi kendine çalışma 3 gün, AlphaGo eski sürümü yendi

Yukarıdaki farklılıklara ek olarak, AlphaGo Zero 3 yönleri önceki sürümü ile karşılaştırıldığında bariz fark vardır
AlphaGo-Zero eğitim zaman ekseni
İlk olarak, AlphaGo Zero sadece giriş olarak satranç tahtası üzerinde siyah ve beyaz kullanır, Ise eski yapay olarak tasarlanmış özellik girişleri az sayıda içerir
İkincisi, AlphaGo Zero sadece tek bir neural ağ kullanır. Önceki sürümlerde, AlphaGo "ağ" stratejisi kullanır sonraki taşımak ve "değer ağı" kullanımı kazanan sonra her adımı tahmin etmek için. Ama yeni sürümde, iki nöral ağ bir yapılabilir. Bu eğitim ve değerlendirme daha verimli elde edebilirsiniz.
Üçüncü olarak, AlphaGo Zero hızlı, rasgele yürüyüş yöntemi kullanmaz. Önceki sürümlerinde, AlphaGo hızlı yürüyüş yöntemi hangi oyun oyuncu geçerli durumdan oyun kazanacağını tahmin etmektir. Aksine, yeni sürümü sinir ağının yüksek kalitede oyun durumunu değerlendirmek için itimat etmektir.

AlphaGo birkaç sürümleri sıralaması
Kazakistan Biscay ve Silva girişine göre, AlphaGo bu farklı Yardım sürümü sistemde geliştirilmiş ve algoritma değişikliği daha güçlü ve daha etkili hale getirmek için sistem yapmak.
Kendini eğitim sadece 3 gün sonra, AlphaGo Zero güçlü Beats AlphaGo eski sürümünde li Shishi üzerinde önceki zafer yendi, onlar 100:0. Kendini eğitim 40 gün sonra, AlphaGo Zero Beat AlphaGo Master sürümü. "Master" dünyanın en iyi oyuncuları yendi, hatta kırmızı de dahil olmak üzere dünyanın ilk sırada.
Yapay zeka DeepMind misyonu kullanarak insan toplumunun ilerlemesini teşvik etmek için, nihai AlphaGo gitmedi, hedeflerinin bir General oluşturmak için AlphaGo kullanmak için, evrenin nihai araçları keşfetmek olmuştur. AlphaGo Zero 'nun yükselişi, yapay zeka teknolojisi atılımını kullanarak insanlığın kaderinde bir değişiklik DeepMind. Şu anda aktif olan ve İngiliz tıp kurumları ve güç enerji sektörü işbirliği, tedavi verimliliği ve enerji verimliliğini artırmak.