Om zelfrijdende auto's te bouwen, moeten fabrikanten drie componenten integreren: software, supercomputers en deep learning.

Het bouwen van een zelfrijdende auto is moeilijk, zei Nvidia CEO Jen-Hsun Huang tijdens een CES 2016 keynote-adres. Om fabrikanten te helpen bij het bouwen van een zelfrijdende auto onthulde Huang een nieuw platform dat het rekenvermogen van ongeveer 150 MacBook Pro's levert.

Riep de Nvidia Drive PX 2, het platform bestaat uit 12 CPU-kernen gebouwd op een 16nm FinFET-architectuur, vier chips met Pascal GPU's en acht teraflops aan verwerkingskracht. Dus hoe krachtig is dit? Huang zei dat de Drive PX 2 waterkoeling vereist om ervoor te zorgen dat deze niet oververhit raakt en in elke omstandigheid en onder elke omgeving kan presteren..

Het eerste bedrijf dat auto's levert met Drive PX 2 is Volvo en Nvidia zegt dat er meer partners zullen volgen.

Een maatschappelijke bijdrage

Nvidia beweert dat er nu twee visies zijn voor zelfrijdende auto's. De eerste visie is om een ​​automatische piloot te maken die menselijke participatie vereist. De tweede visie is vergelijkbaar met de inspanning van Google, die een volledig autonoom voertuig is dat geen menselijke tussenkomst vereist.

Het zelfrijdende auto-probleem oplossen, zegt Huang, is bijdragen aan de maatschappij. Deze autonome machines zullen het verkeer helpen, aangezien er minder auto's op de weg zullen zijn en de auto's op de weg vaker zullen worden gebruikt. Auto's verwijderen betekent dat er meer parken kunnen worden gemaakt als parkeerplaatsen worden geëlimineerd. Bovendien kunnen ongelukken worden voorkomen en zegt Huang dat Nvidia's visie is om een ​​platform te creëren dat deze visie mogelijk maakt.

De sleutel hiervoor is controle. Nvidia wil dat de auto complexe, onvoorspelbare omstandigheden in de praktijk waarneemt, anticipeert op wat er zal gebeuren en beslissingen zal nemen. Het doel is om een ​​end-to-end platform te creëren voor deep learning, een neuraal netwerk. Het deep learning-platform wordt Nvidia Digits genoemd.

De kunstmatige intelligentie vereist voortdurend leren en trainen. Naarmate de auto's leren, wordt er informatie naar de cloud gestuurd en wordt de nieuwe informatie verwerkt, verfijnd en naar andere auto's geduwd.

Het referentieplatform dat Nvidia heeft gemaakt, wordt Nvidia Drivenet genoemd. Het heeft negen aanvangslagen, wat negen diep geneste neurale netwerken is. Dit bestaat uit 37 miljoen neuronen. Nvidia traint het netwerk om de dingen in de wereld waar te nemen. Het netwerk moet dingen in realtime kunnen herkennen en Huang heeft voorbeelden gegeven zoals Shazam die nummers kan identificeren en de beeldherkenningssoftware van Google en Microsoft..

Opleiding

In een demo toonde Nvidia aan dat het algoritme auto's, borden, straatverlichting en de weg kan identificeren. Met GPU-versnelling duurt het een dag om het netwerk te trainen, maar zonder de grafische kracht zou het een maand training kosten.

Telkens wanneer de auto een andere auto of persoon op de weg voelt, wordt een geel vak gemaakt om deze objecten te identificeren.

Dit komt overeen met ongeveer 1,2 miljoen afbeeldingen die zijn gemanipuleerd om er uit te zien als 120 miljoen objecten. GPU-verwerkingskracht zorgt voor snellere training, wat zich vertaalt naar snellere iteraties en updates.

"Er is niet één kenmerkdetectie met de hand gecodeerd", zei Nvidia in zijn demo. "Dit is een werk in uitvoering dat zeer snel is uitgevoerd."

Nvidia meldde dat het met verschillende auto-partners werkte om zijn datasets te bouwen, waaronder Daimler, Ford en Audi.

Nvidia zegt dat het 50 frames per seconde kan bereiken met een hoogwaardige GPU met desktopklasse.

Het diepe neurale netwerk is in staat om een ​​betere straatnaamherkenning te bereiken dan een mensenblik, zei Huang.

BMW gebruikt het netwerk niet alleen voor zelfrijdende auto's, maar ook om zijn productiewerk op de productielijn te inspecteren. Dit betekent dat het platform kan worden gebruikt voor andere toepassingen dan slimmere autonome auto's.

Voorbij objecten

Naast objectherkenning kan het netwerk ook worden gebruikt om omstandigheden te identificeren, zoals rijbanen zonder lijnen, of schoolbussen die u achter moet laten. Dit zijn trainbare dingen.

Het herkennen van omstandigheden zal de volgende stap zijn.

Voor de huidige opstelling heeft Nvidia vier LIDAR-camera's, elk geschikt voor het maken van 40.000 beelden per seconde. Er zijn verschillende configuraties beschikbaar en autoproducenten kunnen verschillende configuraties kiezen met verschillende sensoropties. Het netwerk wordt getraind door de informatie die door deze verschillende camera's en sensoren is vastgelegd te fuseren.

Infotainment om het samen te binden

Alle informatie die wordt verzameld door Drive PX 2, wordt overgebracht naar het infotainmentsysteem. Het infotainmentsysteem van Nvidia wordt de Drive CX genoemd, waarmee bestuurders kunnen zien wat de auto ziet, inclusief andere auto's op de weg, rijstroken op de weg en straten getekend door HERE Maps.

In wezen ziet u uw rit in GPS in realtime met echte informatie onderweg.

"We hebben geen achteruitkijkspiegels meer nodig," verklaarde Nvidia trots, omdat de informatie voor ons ligt.

Drive PX voert de sensorfusie en -berekening uit en vervolgens wordt die informatie verzonden naar Drive CX om de informatie in realtime aan de bestuurder te tonen.

  • Meer van CES 2016