Files |  Tutorials |  Articles |  Links |  Home |  Team |  Forum |  Wiki |  Impressum

Aktuelle Zeit: Di Mär 19, 2024 07:49

Foren-Übersicht » Programmierung » Shader
Unbeantwortete Themen | Aktive Themen



Ein neues Thema erstellen Auf das Thema antworten  [ 1 Beitrag ] 
Autor Nachricht
BeitragVerfasst: So Mär 20, 2022 09:24 
Offline
Forenkatze
Benutzeravatar

Registriert: Mi Okt 22, 2003 18:30
Beiträge: 1944
Wohnort: Närnberch
Programmiersprache: Scala, Java, C*
Hi!

Ich schreibe gerade meine Masterarbeit. Darin untersuche ich u.A., wie ich 2D Faltungen möglichst performant mit CUDA implementieren kann. Ich würde gerne wissen ob die Performance, die mein Code aktuell erreicht, OK ist oder ob da noch mehr gehen sollte.
Aktuell laufen ca. 15360 Faltungen eines 1024x1024 Bildes mit 3x3 Gewichten in ca. 80ms. Ich möchte, dass das 16ms werden.
Das Problem ist ziemlich sicher die Speicherlatenz. Ich benutze bereits Shared Memory und lade in Blöcken von 8x8x32 (weil 32 Channels) und falte dann damit. Außerdem benutze ich fp16 Gewichte, der Bandbreite wegen.

Also, falls hier jemand ist, der sich mit CUDA oder Compute Shadern oder OpenCL auskennt, Hände hoch! Ich kann auch gern mehr dazu erzählen. Hinweise auf aktuelle Literatur zu dem Thema werden auch dankend entgegengenommen :)

Cheers!

_________________
"Für kein Tier wird so viel gearbeitet wie für die Katz'."


Nach oben
 Profil  
Mit Zitat antworten  
Beiträge der letzten Zeit anzeigen:  Sortiere nach  
Ein neues Thema erstellen Auf das Thema antworten  [ 1 Beitrag ] 
Foren-Übersicht » Programmierung » Shader


Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste


Du darfst keine neuen Themen in diesem Forum erstellen.
Du darfst keine Antworten zu Themen in diesem Forum erstellen.
Du darfst deine Beiträge in diesem Forum nicht ändern.
Du darfst deine Beiträge in diesem Forum nicht löschen.
Du darfst keine Dateianhänge in diesem Forum erstellen.

Suche nach:
Gehe zu:  
cron
  Powered by phpBB® Forum Software © phpBB Group
Deutsche Übersetzung durch phpBB.de
[ Time : 0.035s | 17 Queries | GZIP : On ]