Concurrency
Bu bölümün bütün kodlarını burada bulabilirsiniz
Kurgu şu şekilde:Bir meslektaşınız, URL'lerin durumunu kontrol eden CheckWebsites
isminde bir fonksiyon yazar.
Her bir URL'in kontrolünü boolean değer olarak tutan bir map döner - başarılı cevaplar için true
, başarısız cevaplar için false
.
Ayrıca, parametre olarak URL alan ve boolean değer dönen WebsiteChecker
'a parametre göndermelisiniz. Bu, bütün web sitelerini kontrol etmek için kullanılacak.
Dependency Injection kulanmak, gerçek HTTP çağrıları yapmadan fonksiyonu test etmemizi sağlar, güvenilir ve hızlı hale getirir
İşte, onların yazdığı test :
Fonksiyon kullanımda ve yüzlerce web sitesinin kontrolünde kullanılıyor. Ancak meslektaşınız fonksiyonun yavaş oluduğuna dair şikayetler almaya başladı, bu yüzden sizden hızlandırmak için yardım istedi.
Test yaz
CheckWebsites
'ın hızını test etmek için benchmark kullanalım bu sayede yaptığımız değişikliklerin etkilerini görürüz
Benchmark, yüz tane url'in bulunduğu slice'ı ve WebsiteChecker
'ın sahte bir implementasyonunu kullanarak CheckWebsite
'ı test eder. slotStubWebsiteChecker
kasten yavaş. Tam olarak yirmi milisaniye beklemek için time.Sleep
kullanır ve sonra true döner.
go test -bench=.
(veya Windows Powershell'de iseniz go test -bench="."
) kullanarak benchmark çalıştırdığımızda:
CheckWebsites
, 2249228637 nanosaniye olarak ölçüldü - yaklaşık iki saniye.
Hadi bunu daha hızlı yapmayı deneyelim.
Testi geçecek kadar kod yaz
Sonunda concurrency, bir kerede birden fazla işlem, hakkında konuşabiliriz. Bu her gün doğal olarak yaptığımız bir şey.
Örneğin, bu sabah bir fincan çay yaptım. Su ısıtıcısını açtım ve kaynamasını beklerken, sütü buzdolabından çıkardım, çayı dolaptan çıkardım, favori bardağımı buldum, çay poşetini bardağa koydum, su ısıtıcısı kaynadığında, suyu bardağa koydum.
Yapmadığım şey ise, su ısıtıcısını açmak ve boş boş orada beklemekti, ardında su ısıtıcıs kaynadıktan sonra diğer her şeyi yapmaktı
Eğer ilk yöntem ile çay yapmak neden daha hızlı olduğunu anlarsanız, CheckWebsites
'ı nasıl daha hızlı yapacağımızı anlayabilirsiniz. Sıradaki web sitesine istek atmadan önce web sitesinden cevap beklemek yerine, bilgisayarımıza beklerken sıradaki isteği atmasını söyleyeceğiz.
Normalde Go'da doSomething()
fonksiyonunu çağırdığımızda dönüş yapması için bekleriz (dönecek bir değeri olmasa bile yine de bitmesi için bekleriz). Bu işleme blocking işlemi diyoruz - Bitmesi için bizi bekletiyor. Go'da blocklamayan operasyon, goroutine olarak isimlendirilen ayrı bir process'te çalışır. Process'i, Go kod sayfasının yukarıdan aşağıya okunmasi gibi düşünün, fonksiyonun ne yaptığını okumak için her bir fonksiyonun 'içine' gitmek gibi düşünün. Ayrı bir process başladığında, başka bir okuyucu fonksiyonun içini okurken orjinal okuyucu sayfanın aşağısında gitmeye devam etmesine benziyor.
Go'ya yeni bir goroutine başlatmasını söylemek için fonksiyonun önüne go
keywordu koyuyoruz: go doSomething()
goroutine başlatmanın tek yolu fonksiyon çağrısının önüne go
koymak, goroutine başlatmak istediğimizde genellikle anonymus fonksiyonları kullanıyoruz. anonymus fonksiyon literali, normal fonksiyon tanımı ile aynı, sadece isimsiz(şaşırtmayacak şekilde). Yukarıda for
döngüsünün içinde görebilirsiniz.
Anonymus fonksiyonlar onları kullanışlı yapan bir dizi özelliklere sahipler, ikisini yukarıda kullandık. İlk olarak, tanımlandıkları anda çalıştırılabilmeleri - anonymus fonksiyonunun sonundaki ()
işareti bunu yapmakta. İkinci olarak, tanımlandıkları lexical scope'a erişim sağlarlar - anonymus fonksiyonu tanımladığınuz noktada mevcut olan tüm değişkenler, aynı zamanda fonksiyonun body'sinden de erişilebilirler
Yukarıdaki anonymus fonksiyonun body'si, loop'un body'sinin önceki hali ile aynı. Tek fark, loop'un her iterasyonda, var olan process ile concurrent olan (WebsiteChecker
fonksiyonu), her birinin sonucunu result map'e ekleyen yeni bir goroutine başlatması.
Ancak, go test
çalıştırdığımızda:
Paralel(izm) evrenine hızlı bir geçiş...
Bu sonucu alamayabilirsiniz. İleride konuşacağımız olan panic mesajını almış olabilirsiniz. Bunu alırsanız endişe etmeyin, sadece yukarıdaki sonucu alana kadar testi çalıştırmaya devam edin. Ya da yaptığınızı farz edin. Size kalmış. Concurrency'ye hoş geldiniz: doğru şekilde ele alınmadığında ne olacağını tahmin etmek zor. Endişe etmeyin - Bu nedenle test yazıyoruz,
... ve, geri döndük.
Orijinal testler tarafından yakalandık CheckWebsites
şimdi boş bir harita döndürüyor. Ne yanlış gitmiş olabilir?
for
loopumuz başladığında, goroutinelerin hiçibiri sonuçlarını results
map'e ekleyecek kadar zaman bulamıyor; WebsiteChecker
fonksiyonu onlar için çok hızlı, hala boş map dönüyor.
Bunu düzeltmek için, goroutinelerin tümünün işlerini yapmalarını bekleyebiliriz ve sonra geri dönebiliriz. İki saniye bunu yapmalı, değil mi?
Şimdi, testleri çalıştırdığımızda elde edeceğiniz (veya etmeyeceğiniz - yukarıya bakın):
Bu harika değil - neden sadece bir sonuç? Belki, bekleme süresini artırarak bunu düzeltebiliriz - isterseniz deneyin. Çalışmayacaktır. Problem şu, url
değişkeni for
loop'un her iterasyonunda tekrar tekrar kullanılmakta - her defasında urls
'ten yeni bir değer alıyor. Ancak, her goroutine url
değişkeninin referansına sahip - Kendi bağımsız koyalarına sahipr değiller. Böylece, hepsi iterasyonun sonundaki url
'in sahip olduğu değeri yazdırıyor - son url. Bu yüzden elimizdeki tek sonuç son url.
Bunu düzeltmek için:
Her bir anonymus fonksiyon için url parametresi vererek - u
- ve ardından url
parametresi ile anonymus fonksiyonu çağırarak, goroutini başlattığımız loop'un iterasyonu için u
değerinin url
değeri olarak sabitlendiğinden emin oluruz. u
, url
değerinin kopyası, bu sayede değiştirilemez.
Eğer şanslı iseniz, aşağıdakini elde edeceksiniz:
Eğer şanssızsanız (Benchmark çalıştırarak daha çok deneyeceğiniz için elde etmeniz daha olası)
Bu uzun ve korkutucu, ama yapmamız gereken tek şey nefes almak ve stacktrace'i okumak:fatal error: concurrent map writes
. Bazen, testlerimizi çalıştırdığımızda, goroutinelerin ikisi results map'e gerçkten de aynı anda yazar. Go'da mapler, aynı anda birden fazla şeyin kendilerine yazmaya çalışmasını sevmez, sonuç olarak fatal error
.
Buna race condition denir, yazılımın çıktısının zamanlamaya ve kontorlümüzün olmadığı ardışık olayların bağlı olduğu buglardır. Hangi goroutine'in results map'e ne zaman yazacağımızı kontrol edemediğimiz için, aynı anda map'e yazan iki goroutine'e karşı savunmasızız.
Go, built in race detector'ü ile race conditionları testpit etmemize yardımcı olur. Bu özelliği etkinleştirmek için, testleri race
flagi ile çalıştırın: go test -race
Buna benzer çıktılar elde etmelisiniz:
Detayları okuması, tekrardan, zor - ama WARNING: DATA RACE
oldukça açık. Hatanın gövdesini okurken, bir harita üzerinde yazma gerçekleştiren iki farklı goroutin görebiliriz:
Write at 0x00c420084d20 by goroutine 8:
aynı memory bloğuna yazıyor
Previous write at 0x00c420084d20 by goroutine 7:
Bunun üzerinde, yazma işleminin hangi kod satırında olduğunu görebiliriz:
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:12
goroutine 7 ve 8'in başladığı kod satırı:
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:11
Bilmeniz gereken her şey terminalinizde yazdırılır - tek yapmanız gereken onu okumak için sabırlı olmaktır.
Channellar
Bu data race'i channelları kullanarak goroutienleri koordine ederek çözebiliriz. Channellar Go'da değer alan ve gönderen veri yapılarıdır. Bu operasyonlar, detayları ile birlikte, farklı processler arasında haberleşemyi sağlar.
Bu durumda, parent process ile, url ile WebsiteChecker
fonksiyonunu çalıştırma işini yapan, her bir goroutine'i düşünmek istiyorum.
results
map'in yanında artık resultChannel
var, aynı make
ile oluşturduğumz gibi. chan result
channel tipi -result
channel'ı. Yeni tip, result
, WebsiteChecker
'ın dönüş değerini kontrol edilen url ile ilişkilendirmek için yapıldı
string
vebool
yapısıdır. Adlandırılacak her iki değere de ihtiyacımız olmadığı için, her bir yapı içinde anonimdir; Değerlerin isimlendirmek zor olduğunda oldukça kullanışlı olabiliyor.
Url'ler üzerinde iterate ettiğimizde, map
'e doğrudan yazmak yerine, wc
'ye yapılan her çağrıyı result
yapısını resultChannel
'a send statement ile gönderiyoruz. Bu <-
operatörünü kullanır, sol tarafına channel ve sağ tarafına değeri alır:
Sıradaki for
loop, her bir url'i iterate eder. İçerisinde, değeri bir channel'dan alan ve bir değişkene atayan , receive expression kullanıyoruz. Bu da <-
operatörünü kullanır ama iki operand yer değiştirdi: channel sağda ve atayacağımız deişken de solda:
Daha sonra map'i güncellemek için elde edilen result
'ı kullanıyoruz.
Sonuçları bir channel'a göndererek, results map'ine yapılan yazma işlemlerinin zamanlamasını kontrol ediyoruz, sadece bir kere gerçekleştiğinden emin oluyoruz. wc
çağrılarının her biri ve result channel'ına gönderilen her bir çağrı kendi processi içinde paralel olarak gerçekleşse de, sonuç kanalından receive expression ile değerleri birer birer çıkarıyoruz.
Kodun daha hızlı yapmak istediğimiz kısmını paralel hale getirdik ve paralel olarak gerçekleşmeyen kısmın hala lineer olarak gerçekleşmesini sağladık. Channelları kullanarak çoklu processler arasında iletişim kurduk.
Benchmark'ı çalıştırdığımızda:
23406615 nanosaniye - 0.023 saniye, orijinal fonksiyondan yüz kat daha hızlı. Harika bir başarı.
Özetlersek
Bu egzersiz TDD'de normalden biraz daha hafif oldu. Bir bakıma, CheckWebsites
fonksiyonunun uzun bir yeniden düzenlemesinde yer alıyoruz; girdiler ve çıktılar asla değişmedi, sadece daha hızlı oldu. Ama yazdığımız testler, yazdığımız benchmark yanı sıra, CheckWebsites
'ı hala çalıtşığına dair güveni sağlayacak şekilde refactor etmemizi sağladı, aslında daha hızlı olduğunu gösteriyor.
Daha hızlı yapmak için öğrendiklerimiz
goroutines, Go'da concurrency'nin basit bir birimi, aynı anda birden fazla web sitesi kontrol etmemizi sağladı.
anonymous functions, web sitelerini kontrol eden concurrent processleri başlatmamızda kullandık.
channels, farklı processler arasında iletişimi kontrol ve organize etmemize yardımcı eder, race condition bug'ında kaçınmamızı sağlar.
the race detector concurrent kodda problemleri debug etmemize yardım etti
Daha hızlı yap
Yazılım geliştirmenin çevik bir yolunun formülasyonu, genellikle Kent Beck'e atfedilir:
'Çalışma' testleri geçmek, 'doğru' kodu refactor etmek ve 'hızlı' kodu çabucak çalıştırması için optimize etmektir. Bir kere çalışır ve doğru hale getirdikten sonra sadece 'hızlı hale' getirebiliriz. Bize verilen kodun zaten çalıştığını gösterdiği için şanslıydık ve refactor etmemize gerek yoktu Önce diğer iki adım yapılmadıkça, asla 'hızlı hale getirmeyi' denememeliyiz
Vakitsiz optimizasyon tüm kötülüklerin kökenidir -- Donald Knuth
Last updated