DOP 10 et OpenCL

Démarré par Samoreen, Octobre 30, 2014, 12:21:55

« précédent - suivant »

Altho

Citation de: Mikado le Novembre 05, 2014, 10:21:54
Avec mon I5 boosté à 4,2 GHz + 16 Go DDR 3  mais sans CG externe je suis à 15/20s et 60/90s en PRIME (pour des RAW issus de A7R en 36MPix), il est vrai que le contenu et les ISO de la photo sont importants.

Je pense qu'il va être difficile d'améliorer sensiblement ces durées par l'ajout d'une CG externe


ça serait bien que DXO nous indique quelle CG pourrait améliorer ce traitement. J'envisageais un moment d'acheter une NVIDIA Quadro K2200 pour bénéficier de l'affichage 30b/s (600€) mais, je ne suis pas sûr qu'elle offre un calcul plus rapide que celle que j'ai actuellement. Vaste dilemme.

champignac

Citation de: Altho le Novembre 05, 2014, 10:57:14
ça serait bien que DXO nous indique quelle CG pourrait améliorer ce traitement. J'envisageais un moment d'acheter une NVIDIA Quadro K2200 pour bénéficier de l'affichage 30b/s (600€) mais, je ne suis pas sûr qu'elle offre un calcul plus rapide que celle que j'ai actuellement. Vaste dilemme.

il y a 2 ans j'avais posé la question à DXO et vu la réponse évasive....  HD4000.
Personne va le faire pour toi.

titroy

Citation de: champignac le Novembre 05, 2014, 09:52:44
C'est bien pour cela que je garde la carte du processeur.

une photo de 30 mo en prime du 70D est traitée en 23 sec.

Mon un processeur  I7. 3770k overclocker à 4600 m/hz et la carte HD4000 poussée à 1600 m/hz  

A la question 'comment faire mieux' en investissant dans une CG, DxO ne peut pas donner 1 réponse générale car la solution dépend de chaque configuration.

Dans ton exemple, il faudrait :
1/ La carte/driver soient éligibles Opencl, bien sur.  
Et  une horloge à plus de 4600 m/hz (avec un gain significatif)
Et un Bus qui ne sera pas le goulot d'étranglement
Et bien sûr une unité de sortie qui ne freinera pas le processus car lorsque tous les threads sont occupés et si l'écriture (vitesse et buffer) ne suit pas, le thread est en attente.
La performance globale est alignée sur l'élément le plus faible.

Edit : je me suis permis d'utiliser ton exemple, car les données sont précises. Mais effectivement, le processeur est très véloce.

Pieloe

Citation de: titroy le Novembre 05, 2014, 09:32:21
Désolé d'avoir insisté mais si toi tu fais bien la différence, le mythe 'opencl est toujours synonyme de haute performance' a la vie dure pour d'autres.   ;)

+1
... le mythe est tenace.

Citation de: Mikado le Novembre 05, 2014, 10:21:54
Avec mon I5 boosté à 4,2 GHz + 16 Go DDR 3  mais sans CG externe je suis à 15/20s et 60/90s en PRIME (pour des RAW issus de A7R en 36MPix), il est vrai que le contenu et les ISO de la photo sont importants.
Je pense qu'il va être difficile d'améliorer sensiblement ces durées par l'ajout d'une CG externe

Bel exemple de puissance là où elle est nécessaire sur un PC dédié photo.

SuBWaReZ

Citation de: titroy le Novembre 05, 2014, 09:32:21
Désolé d'avoir insisté mais si toi tu fais bien la différence, le mythe 'opencl est toujours synonyme de haute performance' a la vie dure pour d'autres.   ;)

Je pense que personne n'a dit ça. La techno (et son principal concurrent cuda) n'a pas été crée pour rien non plus et est utilisée dans beaucoup de logiciels pro, la CG étant quand même à la base plutôt à l'aise en calcul graphique. Après je ne dis pas que c'est adapté aux algo utilisés dans DxO et que c'est la solution miracle car je n'en ai aucune idée mais, si problème de performances il y a, il peut très bien être dans l'implémentation et/ou architecture logicielle utilisée par DxO. Bref la à la rigueur on s'en fiche, l'utilisateur ce qu'il veut c'est uniquement quelque chose qui marche et qui va "le plus vite possible".

Même dans le cas ou cela revient strictement au même l'intérêt reste quand même de déporter les calculs sur la CG afin de faire autre chose dans de bonne conditions à coté en déchargeant le CPU.
De plus malgré ma petite config (i5 2.4GHz + HD4000) l'oclcheck me dis pourtant  que mon chipset graphique est 20 à 30% plus rapide mais étant sur Mac je ne peux pas activer OpenCL. Dans le cas de l'i7 que tu détaillais plus haut par exemple ça ne m'étonne guerre que le proc soit plus rapide, par contre de la à dire qu'il faut une carte graphique à plus de 4.6GHz parce que le proc est à 4.6GHz pour espérer de meilleures perf faut pas exagérer quand même ce n'est pas comparable de cette manière.

champignac

Citation de: titroy le Novembre 05, 2014, 13:43:35
A la question 'comment faire mieux' en investissant dans une CG, DxO ne peut pas donner 1 réponse générale car la solution dépend de chaque configuration.

Dans ton exemple, il faudrait :
1/ La carte/driver soient éligibles Opencl, bien sur.  
Et  une horloge à plus de 4600 m/hz (avec un gain significatif)
Et un Bus qui ne sera pas le goulot d'étranglement
Et bien sûr une unité de sortie qui ne freinera pas le processus car lorsque tous les threads sont occupés et si l'écriture (vitesse et buffer) ne suit pas, le thread est en attente.
La performance globale est alignée sur l'élément le plus faible.

Edit : je me suis permis d'utiliser ton exemple, car les données sont précises. Mais effectivement, le processeur est très véloce.

Pas de problème, c'est fait pour.

Effectivement comme tu l'écris, les conditions d'un ordi à l'autre sont tellement variables que DXO ne peut donner des chiffres.

Donc il est intéressant de pouvoir faire des comparaisons de nos ordis.




Personne va le faire pour toi.

Mikado

Citation de: champignac le Novembre 06, 2014, 09:52:50
Donc il est intéressant de pouvoir faire des comparaisons de nos ordis.

Le problème est que les temps varient beaucoup selon le type de RAW, sa taille en pixels, les ISO, le bruit à traiter, le niveau de détails de la photo.

Il faudrait traiter le même RAW, avec les mêmes réglages pour pouvoir comparer le comportement de nos configurations. Y-a-t-il un volontaire pour nous proposer en téléchargement un RAW et des réglages?

champignac

      "Y-a-t-il un volontaire pour nous proposer en téléchargement un RAW et des réglages?"

Oui.

Avec ceci  http://www.grosfichiers.ch/fr/  nous pouvons échanger des fichiers volumineux par e-mail.

Sinon comment faire sans Adresse e-mail?     

           
Personne va le faire pour toi.

Mikado

On pourrait prendre par exemple cette photo :

RAW : http://www.imaging-resource.com/camera-reviews/sony/a7r/YDSC01319.ARW.HTM

DxO 9.5 :   20s   Prime :  4mn 13s

DxO 10  :  17s     Prime :  1mn 20s


Autoréglage DxO  standard par défaut export vers disque en JPEG qualité 90.

Rappel de ma config : Windows 7 - 64 bits /  Processeur : QuadCore Intel Core i5-2500K, boosté à 4200 MHz  / 16go de mémoire vive  /  Carte vidéo intégrée :  Intel(R) HD Graphics 3000  (2108 Mo)

Altho

Citation de: Mikado le Novembre 06, 2014, 15:49:29
On pourrait prendre par exemple cette photo :

RAW : http://www.imaging-resource.com/camera-reviews/sony/a7r/YDSC01319.ARW.HTM

DxO 9.5 :   20s   Prime :  4mn 13s

DxO 10  :  17s     Prime :  1mn 20s


Autoréglage DxO  standard par défaut export vers disque en JPEG qualité 90.

Rappel de ma config : Windows 7 - 64 bits /  Processeur : QuadCore Intel Core i5-2500K, boosté à 4200 MHz  / 16go de mémoire vive  /  Carte vidéo intégrée :  Intel(R) HD Graphics 3000  (2108 Mo)


3200 iso ça n'est pas 12800. Je pense que ça serait un peu plus long dans ce cas.
J'obtiens les mêmes valeurs avec mon I7 à 3.4 Ghz mais à qualité 100

Mikado

#35
Citation de: Altho le Novembre 06, 2014, 16:27:25
3200 iso ça n'est pas 12800. Je pense que ça serait un peu plus long dans ce cas.

Ce n'est pas toujours le cas....  par exemple cette photo :

25 600 ISO : http://www.dpreview.com/reviews/image-comparison/download-image?s3Key=36bda9769b2e4a47ac078d02aa245a30.0-1_8s.arw

DxO 10 : 19s Prime 1mn 43s

3 200 ISO : http://www.dpreview.com/reviews/image-comparison/download-image?s3Key=768acbc4e31245ad8a51e40cfccbcb87.0-1s.arw

DxO 10 : 20s Prime : 1mn 45s


belnea

DxO 10  :  14s     Prime :  1mn 08s (sans opencl)
DxO 10  :  11s     Prime :  1mn 08s (avec opencl)
refait deux fois

Autoréglage DxO  standard par défaut export vers disque en JPEG qualité 90.

Windows 7 - 64 bits /  Processeur : QuadCore Intel Core i7-4790 à 3600 MHz  / 8go de mémoire vive  /  Carte vidéo :  GTX 760  (2000 Mo)
Canon R3 Powered

champignac

Tout traité avec DXO10.

1. Prime 64sec. Haute 16sec.

2. Sans open cl  Prime 63sec. Haute 13sec.

3. Sans open cl et  sans accélération gpu Prime 63sec. Haute 13sec.

4. Sans overclocking  Prime 78sec. Haute 19sec.

5. Sans overclocking ni open cl  Prime 76sec. Haute 15sec.

IL faut sûrement une carte graphique haut de gamme pour gagner un temps significatif.  :P                     



Personne va le faire pour toi.

belnea

je viens de refaire le test sous mac. (hackintosh fini à l'instant sur le même pc).
sur prime, je passe de 1,08 à 59 secondes. le reste est pareil mais j'ai pas l'opencl
Canon R3 Powered

Altho

Citation de: champignac le Novembre 06, 2014, 22:33:36
Tout traité avec DXO10.

1. Prime 64sec. Haute 16sec.

2. Sans open cl  Prime 63sec. Haute 13sec.

3. Sans open cl et  sans accélération gpu Prime 63sec. Haute 13sec.

4. Sans overclocking  Prime 78sec. Haute 19sec.

5. Sans overclocking ni open cl  Prime 76sec. Haute 15sec.

IL faut sûrement une carte graphique haut de gamme pour gagner un temps significatif.  :P                     



Il faudrait pouvoir tester avec une carte nvida  quadro ou amd Firefox. 

champignac

Citation de: Altho le Novembre 07, 2014, 08:54:17
Il faudrait pouvoir tester avec une carte nvida  quadro ou amd Firefox. 

Mes connaissances n'ont pas d'ordi performants à canibaliser...  :D

Sinon...

Personne va le faire pour toi.

pereguilou

Citation de: Altho le Novembre 05, 2014, 09:56:49
Avec mon i7 - 3.4 Ghz + CG Radeon HD7770 + 16 Go DDR 3 : 15 s et 90 s en prime pour un fichier D810.
DXO m'indique aussi que ma CG serait moins rapide que le CPU. J'ai bien sûr désactivé la CG intel dans le bios.
Je pense que la durée du traitement prime dépend du contenu de l'image et de l'iso. Une photo très détaillée prise à 12800 iso sera plus longue à traiter qu'une autre à 6400 présentant un large fond noir.


Tout cela me semble plutôt lent: avec un I7 2600K et une HD7950, mes blocs de 100 photos de D300 (1 à 1,3 Go) sont traités en 3 à 5 mn, sans PRIME.
Un bloc entièrement traité par PRIME est traité en 31 à 35 mn. Mais, sauf erreur de ma part, PRIME n'utilise pas la CG !
P.-S. je traite 6 images simultanément

gerarto

Heu... juste pour dire qu'il semble normal que le traitement d'un raw de D810 à 36 Mpix nécessite plus de temps qu'un raw de D300 à 12 Mpix !  ;) 

belnea

faut croire que c'est le bonhomme qui est + lent à comprendre que la machine. faut qu'il s'upgrade  ;D
Canon R3 Powered

champignac

Citation de: pereguilou le Novembre 07, 2014, 10:33:41
Tout cela me semble plutôt lent: avec un I7 2600K et une HD7950, mes blocs de 100 photos de D300 (1 à 1,3 Go) sont traités en 3 à 5 mn, sans PRIME.
Un bloc entièrement traité par PRIME est traité en 31 à 35 mn. Mais, sauf erreur de ma part, PRIME n'utilise pas la CG !
P.-S. je traite 6 images simultanément

Pereguilou pour participer au concours, il faut traiter cette photo.

http://www.imaging-resource.com/camera-reviews/sony/a7r/YDSC01319.ARW.HTM

autoréglage DxO  standard par défaut export vers disque en JPEG qualité 90.

Le dernier paie la tournée.
Personne va le faire pour toi.

Altho

#45
14 s et 3min 40 s avec prime. Mon i7 3770 (pas K) n'est pas overclocké (3.4 Ghz). Ce qui prouve que c'est le proc qui bosse en Prime et que DXO 10 n'utilise pas la CG dans ce cas. Je pense que les nouveaux proc 6/12 cœurs + DDR4 devraient encore mieux gérer l'encodage. Mais cela a un prix !

Mikado

Les résultats se situent dans une fourchette de temps de l'ordre de 25% selon les configurations.

Comme les temps de traitement Prime viennent d'être divisés par 3 en passant de DxO 9.5 à 10   :)    25% cela semble peu  :'(

J'attendrai qu'une configuration (Proc. ou CG)  puisse diviser les temps par 2 avant de faire évoluer la mienne, mais si DxO continue à améliorer leurs processus de traitement, cela ne sera peut-être pas nécessaire.

Altho

Je viens de refaire les tests (j'ai enregistré le fichier sur mon DDur)
DXO v9.52 : 15s et 3min 41 en prime
DXO v10 (maj 821) : 14s et 1 min 17 en prime
Donc : moitié du temps en prime

Mikado

Citation de: Altho le Novembre 07, 2014, 18:14:38
Je viens de refaire les tests (j'ai enregistré le fichier sur mon DDur)
DXO v9.52 : 15s et 3min 41 en prime
DXO v10 (maj 821) : 14s et 1 min 17 en prime
Donc : moitié du temps en prime


Presque 3 fois moins....  221 / 77 = 2,9. Ce qui rejoint ce que j'ai aussi constaté

champignac

Vu les temps obtenus par les différentes configurations.

Il me semble aussi qu'il valle mieux investir pour un processeur puissant.

Pour pouvoir conclure ils nous manque quelqu'un qui puisse faire le test avec un ordi au proc. et une cg les 2 au top.   
Personne va le faire pour toi.