VRAM Requirements for AI Models Across Hardware Architectures

AI Dynamics

Global AI News Aggregator

VRAM Requirements for AI Models Across Hardware Architectures

–

31 October 2024 12h02

It should work on CPU/ CUDA/ MPS across backends, w.r.t hardware requirements: 1B should take roughly 2GB VRAM to load in fp16/ bf16.
600M should take 1.2 GB VRAM
350M – ~700MB VRAM
125 – ~250MB VRAM Ofcourse at lower quants Q4/ Q8 you reduce this even further.

→ View original post on X — @reach_vb,

31 October 2024

AI AI HARDWARE COMPUTING HARDWARE LLMS MACHINE LEARNING SOFTWARE

AI Dynamics

VRAM Requirements for AI Models Across Hardware Architectures

Commentaires

Leave a Reply Cancel reply

MORE ARTICLES

Cybercab Uber: Safer, Cheaper Alternative for Single Riders

Zeekr Global Unveils Latest Electric Vehicle Model

Revolutionary New Camera Technology Unveiled

Hidden Camera Recording Family Interactions Raises Privacy Concerns