Ma configuration :
- Proxmox : 8.4.1 ( kernel : Linux 6.8.12-10-pve (2025-04-18T07:39Z) )
- VM sous Ubuntu : Ubuntu 22.04.5 LTS ( kernel : 5.15.0-140-generic )
- Ollama : 0.9.0 ( Le : 0.5.7 ) : https://ollama.com/
- Python : 3.10 (pour AUTOMATIC1111) & 3.11 (pour Ollama)
- Open WebUI : 0.6.13 : https://github.com/open-webui/open-webui
- NVIDIA : 575.51.03 .( Le : 570.86.15 )
- CUDA : 12.8.93 ( nvcc –version )
- AUTOMATIC1111 : 1.10.1 : https://github.com/AUTOMATIC1111/stable-diffusion-webui
J’ai lancé un nouveau test via llm_benchmark, afin de comparer avec ma dernière configuration fonctionnelle :
-------Linux----------
{'id': '0', 'name': 'Quadro M5000', 'driver': '575.51.03',
'gpu_memory_total': '8192.0 MB', 'gpu_memory_free': '8110.0 MB',
'gpu_memory_used': '5.0 MB', 'gpu_load': '0.0%', 'gpu_temperature': '43.0°C'}
{'id': '1', 'name': 'Quadro M4000', 'driver': '575.51.03',
'gpu_memory_total': '8192.0 MB', 'gpu_memory_free': '8110.0 MB',
'gpu_memory_used': '5.0 MB', 'gpu_load': '0.0%', 'gpu_temperature': '46.0°C'}
At least two GPU cards
Total memory size : 119.03 GB
cpu_info: Intel(R) Xeon(R) CPU E5-2450 v2 @ 2.50GHz
gpu_info: Quadro M5000
Quadro M4000
os_version: Ubuntu 22.04.5 LTS
ollama_version: 0.9.0
----------
...
At least two GPU cards
{
"mistral:7b": "12.31",
"llama3.1:8b": "12.81",
"phi4:14b": "6.75",
"qwen2:7b": "11.36",
"gemma2:9b": "11.79",
"llava:7b": "13.60",
"llava:13b": "10.34",
"uuid": "2a3d3de2-5e53-5b28-a909-62559c5a817c",
"ollama_version": "0.9.0"
}
Avec toutes les versions à jours (kernel, soft, drivers), je suis passé de « llama3.1:8b »: « 15.71 » => « 12.81 ». ( – 20% )
La configuration sur OpenWebUI : (valeurs par défaut) , lire https://stable-diffusion-art.com/samplers/ .
- Définir le sampler : Euler a
- Définir le planificateur : Karras
- Définir la CFG : 7
- Définir le modèle par défaut : v1-5-pruned-emaonly.safetensors [6ce0161689] ( https://huggingface.co/stable-diffusion-v1-5 )
- Définir la taille de l’image : 512×512
- Définir le nombre d’étapes : 50

Résultat : un mouton . ( via llama3.2:latest )

Misère.
