Nouveau PC Intel ou Amd?

Démarré par Hitman_11, Juillet 06, 2020, 18:38:38

« précédent - suivant »

yorys

Citation de: Zaphod le Juillet 25, 2020, 19:51:24
...
Par contre ils devraient bosser sur une version approximative pour visualiser les résultats parce que la fenêtre de 50 pixels de large c'est chaud.

Je pige pas cette remarque...
???

Zaphod

Actuellement le prime ne se visualise que dans une fenêtre de dimension ridicule.
Bref on est obligé d'exporter pour voir si les paramètres conviennent à l'image.

Je suis persuadé qu'il y aurait moyen de donner une visu approximative du résultat dans la fenêtre principale... visu non contractuelle :) mais qui permette d'ajuster les paramètres correctement sans faire d'export.

fabco

Bonsoir,

L'apport d'un ssd pour photolab n'a pas rien ou presque rien.

Par contre il faut un proc puissant et de la mémoire.

Une photo traitée = au maxi 2 Go de mémoire.

Il est plus avantageux de mettre moins de fichiers à traiter simultanément.Pour ma machine qui n'est plus très jeune je suis plus rapide avec 3 fichiers que 4 qui est le maxi pour mon I5 750.

C'est un essaie à faire.

Effectivement la fonction prime n'utilise pas le gpu, dxo l'avait annoncé il y a quelques années.  ;D

ChatOuille

Citation de: Zaphod le Juillet 25, 2020, 19:51:24
Mouais, après quand tu choisis de mettre prime, c'est que tu ne veux pas faire de compromis.
Par contre ils devraient bosser sur une version approximative pour visualiser les résultats parce que la fenêtre de 50 pixels de large c'est chaud.

Ce n'est pas du tout ce que j'ai voulu dire, bien au contraire. Ce n'est pas pour rien que j'ai mis le mot « simplifier » ente guillemets, pour éviter des malentendus. Il ne s'agit pas de brider mais d'utiliser mieux les ressources afin d'obtenir le même résultat mais plus rapidement. Et au passage ils pourraient améliorer (agrandir ou pleine image) la petite fenêtre du Prime. Il faut reconnaître que depuis le début ils se sont pourtant bien améliorés.

fabco

Citation de: Stepbystep le Juillet 26, 2020, 19:40:46
DPL exploite le nombre de cœurs et il vaut donc mieux avoir une machine avec beaucoup de cœurs pour paralléliser les traitements de masse.  Lors d'un export, je traite en moyenne entre 300 et 1000 images, parfois plus. Donc, ce qui m'intéresse c'est la rapidité sur des gros volumes. Traiter 3 ou 4 images à la fois rallongerait énormément les temps de traitements.

Sur 32 Go de Ram, lors d'un export je me retrouve autour des 22 Go sachant que j'ai généralement Firefox qui est lancé aussi et qui  consomme beaucoup de mémoire.

Le gpu étant utilisé pour les autres fonctions que prime, il serait intéressant d'avoir des retours sur le performances en fonction de la carte graphique.

Je n'ai pas dit qu'il faut 3 ou 4 cores mais utilisait le maxi de tes cores n'est pas forcément la bonne solution.
Comme tu as 8 cores vrais et 8 cores dédoublés, il serait intéressant de faire un traitement avec 14 et même 12 traitement pour voir si tu ne gagnes pas en temps sachant que la fréquence du proc ne sera peut être pas la même.

C'est quoi la référence de ton proc.

fabco

Ce n'est pas un sentiment mais une réalité.

Je l'avais lu il y a quelques années les conseils de dxo, bien avant dxo9.Depuis dxo9 le calcul a été changé est le nombre de traitement diminué en fonction du proc.

Je viens de refaire le test proc de 4 cores

recommandation de photolab 2 images si je met 3 ou 4 image le temps de traitement est plus long sur un batch de 31 images en HQ.
C'est identique si j'utilise prime mise à part que le temps est multiplié par 5.5.

A toi de voir en fonction des recommandations de photolab

fabco

autres tests
raw de A7 IV 62Mp temps de traitement / photo en HQ 37s sur un batch de 5 photos
raw de A7 III 24Mp temps de traitement / photo en HQ 11s sur un batch de 31 photos

proc de 10 ans i5 750 4 cores + cg 6850hd cyclone + 8 go de mémoire

fabco

#32
J'ai écrit que ma machine avait 10 ans donc forcément avec un proc de l'époque qui était un moyenne gamme +.
Non tu te trompes il ne swappe pas et je n'utilise pas les 8 go de mémoires.

Il sera difficile de trouver un configuration identique à la tienne, ce n'est qu'en faisant des essaies que tu pourras voir si tu peu optimiser ou pas ton traitement.

J'ai également fait des traitements sous prime , le temps est multiplié par 4.5 pour les mêmes photos et la je n'utilise que le proc.
Le temps le plus court est avec 2 cores et donc 2 traitement à la fois.

En prenant un 3900 tu aurait gagné du temps mais dépenser plus.Il est bien au dessus de ton 3700

Photolab te recommande t-il 16 traitements à la fois ou te donne t'il la possibilité de le faire?

Dans ce traitement il y a forcément un couloir d' étranglement, rien que le transfert des donnés du SSD vers la mémoire.

fabco

La mémoire n'est un frein, car même en 4 fichiers, je ne sature pas .

Je répète que photolab me recommande x2 alors que je peux mettre x4.En x4 j'augmente le temps de traitement de 1.5s par photos

Ce que tu peux essayer aussi et de faire tourner photolab seul, sans d'autres applications ouverts, tu peux peut être gagner quelques choses à vérifier.

fabco

#34
Intéressant tes données, contrairement à ce que tu pensais ce n'est pas parce que tu traites plus de fichiers simultanéments que le traitement final est plus court.

Que la mémoire consommée soit plus faible c'est logique, dxo a indiqué qu'il fallait 2 go par process au maxi

De mon côté j'ai refait quelques tests en utilisant comme témoin speccy qui permet de voir la fréquence des cores.
La fréquence est la même même en limitant le nombre de fichier à traiter , par contre tous les cores sont en actions mais pas à 100% .

Le fait de dire un core = un traitement n'est pas totalement vrai ou alors une méthode de calcul simplifié de dxo pour les utilisateurs.

Il semblerait que plus la fréquence du proc est élevé moins le traitement serait long.Mon proc tourne à 2.8Ghz.

Il est difficile d'en tirer une conclusion pour diminuer le temps de traitement.

La fonction prime n'utilise le GPU mais d'autres fonctions l'utilisent.
Si je désactive prime ou hq le temps de traitement baisse significativement.
De même les fonctions de retouche local consomme beaucoup de temps de traitement.

Peut être, peux-tu demander au sav dxo pourquoi le temps de traitement ne change pas entre 8 et 16 fichiers ?

fabco

un lien intéressant
https://feedback.dxo.com/t/about-gpu-acceleration/7960/23

ou l'on retrouve tes constatations avec une machine semblable à la tienne.

fabco

La question que je me pose, c'est quel serait l'apport d'une CG avec un GPU performant, négligeable ou significatif ?

avec prime rien

avec hq difficile à dire sans essayer et il faudra taper  dans le haut de gamme.

Avec ma machine j'ai un gain de 4 environ par rapport à une cg d'entrée de gamme de 10 ans.

Si je la changerais je devrais avoir un gain mais de combien ?
si c'est que quelques secondes cela ne vaut pas la peine.


yorys

Citation de: fabco le Juillet 27, 2020, 21:38:44
La question que je me pose, c'est quel serait l'apport d'une CG avec un GPU performant, négligeable ou significatif ?

avec prime rien

avec hq difficile à dire sans essayer et il faudra taper  dans le haut de gamme.

Avec ma machine j'ai un gain de 4 environ par rapport à une cg d'entrée de gamme de 10 ans.

Si je la changerais je devrais avoir un gain mais de combien ?
si c'est que quelques secondes cela ne vaut pas la peine.

Le problème avec un CPU "performant" c'est qu'il faudra une CG très performante aussi pour ressentir une amélioration... en activant Open CL j'ai ressenti une meilleure fluidité dans l'affichage et le traitement des "gros" fichiers RAW, plus, comme je l'ai écrit plus haut, un gain d'environ 20% sur l'exportation des JPG.

Maintenant avec un processeur 24 cœurs / 48 threads cela n'a pas non plus été une "révolution" même avec une CG haut de gamme (2080S) ...

Voilà un extrait de log pour comparer avec ce qu'a publié Stepbystep :

egtegt²

Pour ce qui me concerne, j'ai une carte graphique plutôt performante (RTX2070S) et un core I7 avec 4 coeurs donc rien de fantastique comme proc. j'ai fait quelques tests et je n'ai pas constaté de différence significative de temps entre le traitement CPU et le traitement GPU. Par contre, l'impact sur l'utilisation du PC par ailleurs est moindre en utilisant la carte graphique.

Mais au bout du  compte, gagner des minutes de traitement a peu d'intérêt pour moi, dès que ça dure plus de 5 minutes, je fais autre chose et je me moque un peu sauf cas rare de la durée exacte du traitement. Ce qui compte par contre, c'est l'utilisation interactive du logiciel.

yorys

Et pour faire un test d'export comparable, export sur disque (SSD) de 266 NEF de D850 (24 images simultanées)

Sans OpenCL : 9'52"

Le proc se cale au bout de 2 mn à 100%

Avec OpenCL : 8'29"

le proc oscille entre 80 et 100%

Dans les deux cas les 48 threads semblent utilisés.

Graphe proc sans open CL (et modèle) :

yorys

Et une dernière capture avec OpenCL activé, on voit que la carte graphique est utilisée de manière conséquente (en fait ça varie entre 75 et 100%) :


yorys

J'ai oublié de préciser que les tests d'export ci dessus ont été fait vers des Tiffs 16 bits pour être comparables avec les chiffres de Stepbystep...

yorys

Citation de: Stepbystep le Juillet 28, 2020, 12:23:00
Merci pour ces retours.

Est-ce que tu avais activé Prime ?


Non, je suis justement en train de faire le test avec Prime, c'est, sans surprise, beaucoup plus long !

Citation de: Stepbystep le Juillet 28, 2020, 12:23:00

Je trouve que sur 24 images, la différence est assez significative. Pourrais-tu refaire l'essai sur un plus grand nombre (+ 100) pour confirmer que l'écart est proportionnel au nombre d'images ?

Il faudrait aussi indiquer combien d'images simultanées tu as paramétré dans Dxo. On voit que la mémoire est à 35 Go; donc tu dois être au moins à 24 images ?


Oui, comme dit plus haut, je veux bien ferai un essai avec 100 images mais comme le proc est déjà à 100% (ou presque) avec 24 je doute que le résultat soit transcendant.

Citation de: Stepbystep le Juillet 28, 2020, 12:23:00

La CG étant utilisée entre 75 et 100%, on peut penser qu'elle a un impact significatif sur la durée de traitement. Tu n'aurais pas une ancienne CG moins performante avec laquelle tu pourrais faire un essai ?

Je sais que je demande beaucoup, mais si tu peux le faire, cela permettrait de valider ou infirmer l'importance de la CG par rapport à Dxo.  ;) :)

Dans mon cas, l'utilisation semblait plutôt varier entre 1 et 100% ?

Ça désolé mais non, c'est ma machine de travail, et je n'y fais des interventions matérielles que quand c'est absolument nécessaire, en plus il faudrait changer les drivers (je n'ai qu'une vieille AMD sous la main), etc... 

yorys

Citation de: Stepbystep le Juillet 28, 2020, 12:50:49
...
J'ai demandé aussi s'il fallait mieux mettre le nombre d'images traitées en simultané égal au nombre de coeurs ou de threads. Je n'ai pas compris ta réponse sur ce point. Tu as paramétré combien ?

Oui, j'ai paramétré 24.

Sinon je confirme qu'en cas de conversion Prime la CG ne sert quasiment à rien :

Le même set d'images que précédemment testé avec Prime :

Avec OpenCL : 40'44" (soit 9.1" par image)

Sans OpenCL : 41'27"

Et la CG ne semble utilisée que toutes les 7-8 sec le reste du temps (sans doute pendant Prime, elle est à 0%)

Bref pour le cas spécifique du traitement Prime, changer de carte graphique ne me semble servir à rien...

egtegt²

Citation de: Stepbystep le Juillet 28, 2020, 13:36:54
Je viens de faire un test sur 24 images de D850 générées en tiff sur DD avec Prime et opencl activé. Paramétrage 8 images en simultané (le même essai avec 16 images donnait 1mn32s de plus)

Temps de traitement 11mn 22s soit environ 28 secondes par image. Contrairement à Yorys, la CG est très peu sollicitée, alors que les logs disent que la CG est plus rapide que le cpu,  je ne sais pas pourquoi, quelques pics à 100%, mais la plupart du temps elle est à 1 ou 2%.  ???
Je n'ai pas fait de mesure précise mais j'avais fait les même comparaisons avant de changer de CG, j'avais à peu près les même comportements : l'utilisation de la CG ne change pas grand chose. Je suis passé d'une GTX1060 à un RTX2070S.

De mémoire, la GTX1060 était légérement moins performante que la CPU, la RTX2070S est un peu plus performante.

yorys

Citation de: Stepbystep le Juillet 28, 2020, 15:32:06

En conclusion, avec Prime, c'est bien le proc et le nombre de cœurs qui est important. Entre ta machine avec 24 cœurs et la mienne à 8 cœurs, il y a un ratio d'environ 1/2 sur la durée de traitement. A chacun de décider où il veut mettre le curseur.
...

Passer de 28" à 9" c'est plutôt 1/3... mais bon, je n'ai pas pris le Threadripper en fonction de mes besoins de traitement photo...

egtegt²

Citation de: Stepbystep le Juillet 28, 2020, 19:11:00
j'ai pris comme référence le traitement du lot de 303 images, mais c'est vrai que c'est du D800, pas du D850.

Je pense que le temps moyen par image baisse si on augmente le nombre d'images traitées, mais je ne sais pas jusqu'à quel nombre d'images.

J'ai relancè un test sur 344 images de D850.  ;D
J'avais fait quelques tests, le résultat sur mon PC m'a semblé assez logique : j'ai quatre coeurs et le plus rapide est avec 4 images traitées simultanément. Les threads Intel sont assez symboliques et ça ne m'étonne pas qu'ils ne permettent pas vraiment d'accélérer le traitement. Il faudrait faire le test sur des processeurs IBM Power qui eux ont de véritables multithreads mais DXO ne tourne pas dessus :(

egtegt²

Vu que la plupart des processeurs Intel actuels ont deux threads et donc deux coeurs logiques par coeur physique, ça revient à ne pas dépasser 1 image simultanée par coeur physique. Mais vu le peu de précision de la réponse du support, je suppose qu'ils ont simplement fait comme nous : ils ont testé et déduit le chiffre des résultats de calcul.

fabco

Je pense qu'il n'y a pas de configuration miracle et le plus simple faire des tests en fonction de sa machine et des fichiers à traiter.

A priori, il vaut mieux privilégier un nombre de core physique élevé et ne pas s'occuper des cores logiques.

fabco

oui un core physique = un traitement.

tu as fait l'essaie et le résultat est identique