Aasta “Hommikpaber” - väljaanne 2018

Jätkates minu austatud traditsiooni alates selle loomisest 2017. aastal, on siin minu arvates nimekiri parimatest / kõige huvitavamatest / kõige asjakohasematest / kõige avatavamatest artiklitest, mida The Morning Paper on esitanud kursuse jooksul uskumatu Adrian Colyer. eelmise aasta.

AI ja sellised

Konkreetsed probleemid ja AI ohutus

AI tehno-utooplaste ja AI-i viimsepäeva prohvetite vahel asuvad AI nohikud, lihtsalt mõnu ajades probleemidele järele. Autorid esindavad mõnda selles valdkonnas töötavat telklauda ja nende maine tagab, et me pöörame sellele tähelepanu. Taksonoomiad aitavad põldude teadmisi destilleerida seeditavateks tükkideks ja see paber on esitatud sisutihedate ja võhikutele sõbralike ravimvormide abil, nagu näiteks "tasu häkkimine". (Nad võisid seda teha vaid nii kaugele, et lõpuks nõustusid haprusega jaotuste nihke korral, kui “segadus ootamatus keskkonnas” oleks just hästi õnnestunud.) Naljaga pooleks võib öelda, et paber on erakordselt kättesaadav ja autorid tegid fantastilise töö näidetega. Rääkides robotitest, mis purustavad urnid, et nad saaksid puhastustasusid optimeerida, on minu jaoks kõige naljakam see, et me teame, et robotitel / agentidel oleks neid probleeme lihtsate objektiivsete funktsioonidega - kas inimestel pole neid probleeme kogu aeg? (Näpunäide arendajate kohta, kes lubavad vead oma koodi, et nad saaksid veaparanduse boonust.)

ELi algoritmiliste otsuste tegemise eeskirjad

Kui tech-ajakirjandus, peavoolu ajakirjandus ja Hacker News räägivad kõik Euroopa Liidu määrusest - EL määrusest - varjatud ja lugupidaval viisil. - võite olla kindel, et midagi on käimas. Nojah, mis toimub, on võimalik (ja võib-olla ka täiesti tahtmatu) rünnak AI mudeli hindamise väljaütlemata reegli keskmes: kui tõend on tulus, kõik muu tuleb neetud. Kuni määrust on tegelikult kontrollitud õigusliku väljakutsega või võib-olla mitme õigusliku väljakutsega, jääb selle täielik reguleerimisala tõlgendamise ja spekuleerimise küsimuseks. Sellegipoolest muudab algoritmide ohvritele (või „subjektidele”) õiguse andmine teada, miks otsus tehti, seletatavus [m | b] illusiooni ja dollari vahel.

Sama statistika, erinevad graafikud

Ma valisin selle lihtsalt T. Rexi jaoks, kui aus olla.

Neuraalse arhitektuuri otsing tugevdusõppe abil

See artikkel oli üks, mis tõi välja mõned aktiivsed uurimistööd, mis toimusid Pedro Domingos hõimu ristumiskohas Meisteralgoritm. Kenneth Stanley hüppas selles osas üsna sageli välja artikleid, kõnelusi ja netisaadetega neuroevolutsiooni kohta.

Dünaamiline marsruutimine kapslite vahel

Kohustuslik kaasamine. Me ei tea veel, kui mõjus see on, kuid mõni Hintoni eelnev töö on osutunud, ütleme, et seda on alahinnatud, "mõnevõrra kasulik".

Automaatne andmebaasihaldussüsteemi häälestamine

Igavate vanade ettevõttesüsteemide igavas vanas maailmas on administraatorid tavapäraselt hädas konfiguratsiooninuppudega. Tore, et inimesed mõtlevad ka nendele administraatoritele. Hooray! ML ei tähenda ainult kuumade koerte ja kuldsete retriiverite vahet rääkimist. Larry Ellison muutis turunduse kuni 11-ni oma kuulutusega Oracle Autonoomse Andmebaasi Pilve kohta Oracle OpenWorld 2017, kuid selleteemalisi uurimistöid on tehtud palju.

See toob endaga kaasa olulise väljakutse. Mida läbipaistmatum on must kast - ja enamus ettevõtte tarkvara on üsna läbipaistmatu kast -, seda enam jäävad kasutajad ilma musta kontrolliga kasti käitumise kontrollimisest. Seda täiendab asjaolu, et tõenäoliselt ei suuda isegi musta kasti ehitajad sageli rahuldavalt selgitada, miks must kast tegi seda, mida ta tegi.

Mida siis teha? Raja alternatiivid, näiteks Bayes'i meetodid.

PAAT: Auto-tuunerite ehitamine struktureeritud Bayesi optimeerimisega

Ja teine ​​siseneja süsteemi optimeerimise teemale. Minu jaoks on selle paberi üks huvitav külg see, et see näib olevat osa Bayes'i meetodite vastu ilmnenud taastekkest, osaliselt vastusena selliste süsteemide tugevale selgitatavuse soovile. Võib-olla ei ole sugugi nii huvitav aru saada, kuidas modell sai aru, milline on Van Goghi maalistiil Starry Nightsis, kuid kindlasti oleks huvitav, kui võrguseadmed otsustaksid, et konkreetse ühenduse katkestamine on üldiselt parem ja siis ei õnnestu selgitada vihasele kasutajale, kuidas see nii oli.

Tarkvaraarendus

Tarkvara paindlikkuse mõistmise kohta

See ei ütle seda päris täpselt, kuid paber väidab, et sattume liiga sageli ellujäämise eelarvamuste lõksu - omistades tagasiulatuvalt ennustatava väärtuse, kui seda ei olnud, mitmesugustele võetud toimingutele või aset leidnud sündmustele. Pigem oleks kohane aktsepteerida süsteemi (inimesed, äri, tehnoloogia, kood,…) keerukust (mitte lihtsat keerukust) ja astuda sammu väikeste sammudega, jälgida selle sammu mõju, uurida muudatusi keskkonnas, kohandades vastavalt vajadusele ja astudes siis veel ühe väikese sammu. ML inimesed nimetavad seda gradiendi laskumiseks. Tarkvaratehnika inimesed nimetavad seda "Agile". Juhib mind tagasi punkti, milles olin kõige rohkem nõus, kohe paberi alguses, mille Adrian kokku võtab:

Agile algne vaim on sageli asendatud reeglite ja kontrollnimekirjade vedamisega

Testipõhise arendusprotsessi lahkamine

Siin on teine ​​artikkel, mis uurib nähtust, mis näib praktikas üsna hästi toimivat, ja püüab seda teooriaga alistada. Ma kahtlustan, et TDD-d ümbritseva religioosse lõhe mõlemal pool olevad inimesed võtavad selle paberi hästi vastu, sest nad nõustuvad ainult sellega, et reeglina kehtivad väikesed partiid (Toyota, Lean jne).

Kuidas keerulised süsteemid ebaõnnestuvad

Nauditav tarkvarasüsteemidele, isegi kui autor on MD ja kirjutad tervishoiu seisukohast! Vaatluste seeriana korraldatud on täiesti hämmastav (võib-olla see räägib minu teadmiste piiratusest), kui paljud neist rakenduvad otse tarkvarasüsteemidele. Parim tähelepanek partii kohta on minu arvates „Komplekssed süsteemid töötavad seetõttu normaalses töörežiimis halvenenud režiimis”, kuid on mitmeid märkusi, näiteks RCAga seotud ohtude ja tootja / operaatori tasakaal ja mis juhtub, kui nad on üks ja sama inimene. Võib-olla vaid väikese annuse kinnitava eelarvamusega pole raske näha kõiki viise, kuidas see Agile, Lean ja DevOps toetab.

Pilv

Serverita andmetöötlus: majanduslik ja arhitektuuriline mõju

Esimene paarist paberit paradigma muutuse kohta, mida nn serverless toob. Minu jaoks öeldakse selle nime järgi: muidugi on kuskil server käivitamas koodi, kuid arendaja jaoks pole ühtegi serverit. Serverivaba muudab pilvandmetöötluse koodiks - arendaja peab muretsema millegi muu pärast. Muidugi, see paber on väga mutrid ja poldid, dollarid ja sendid, plussid ja miinused. Mõelge sellele kui CFO-le ja CIO-le või ThoughtWorks Technology Radarile ettekande akadeemilise versioonina. Selle eesmärk ei ole kedagi veenda milleski, kuid see asetab serverita valduse, mis meie sõnul on mõistlik.

Hajus pilvisus

Kunagi Silicon Valleys maksnud Vinod Khosla ütles ühel konverentsil: “Muutmine on ainus asi, mida tasub optimeerida.” Daamid ja härrad, ma annan teile: serverita. See teine ​​paar dokumentidest, mis mulle selle teema juures meeldis, on rohkem laiema visiooni avaldus, mis püüab toetada tuge väitele, et tugevalt lahutatud arhitektuuri eelised, keskendudes selliste optimeerimiste nagu arvutus- / andmete koondamine, märkides, et AWS EC2-l on kaugmällu kirjutamine kiirem kui andmete salvestamine ühele kohalikule SSD-le. Tõenäoliselt ei veenda see skeptikuid, kuid see kindlasti nõrgendab nende vastupanuvõimet. Ma võtan natuke vaeva formuleeringuga “hajutatud andmetöötlus 99% -le”. Ma eelistaksin öelda “pilvandmetöötlus 99% -le” - see annab neile 99% -le võimaluse kasutada pilvi, muretsemata (liiga palju) hajutatud andmetöötluse pärast.

Mutrivõti

See oli omamoodi kohustuslik kaasamine, mille kõik hüpe selle ümber oli. Globaalne! Jaotatud! Ei opisid! HAPP! ÜPP! Aatomkellad! Sellel teadaandel oli jaheduse väärtus väljaspool andmebaasi geekdomi.

BRR: ummikupõhine ummikute kontroll

Minu nimekirjas oleva viimase paberi puhul on noogutus sellele, mis minu arveid maksab - võrgustike loomine. Nii ebaotstarbekas kui torustik, sama oluline ja nii keeruline, kui asjad ummistuvad. Kiire kõrvale jättes on puhverpuhumine võrgustamises üllatavalt valesti mõistetav probleem („terve mõistus ja kõik see”) ning see on midagi, mida õppisin Citrixi ekspertkolleegidelt WAN-i optimeerijate töös ja muu selline. Adrian esitas oma 2017. aasta ajaveebide parimad visuaalid, selgitades TCP ummikute kontrolli probleemi ja kuidas BRR sellega tegeleb.

Nii et teil see on. Teabe tulv jätkub ja tänu Adrian Colyeri kureerimispüüdlustele saame selle mõtet sisuliselt ära seedida.

Ootan huviga Adriani 2018. aasta valikuid!

Boonuspaberid

Kasutage pilvepõhist virtualiseerimist. Hüperviisori teadlik virtualiseerimine on nii passiivne. Tuntud ka kui “pilv on uus opsüsteem”.

Ehkki nende veebimahu kasutamine on tavaline, näivad loendusfiltrid olevat väga kasulikud, kuid võrkude loomisel on need alakasutatud. Huvitav miks.