AI Dynamics

Global AI News Aggregator

@reach_vb

Optimizing llama.cpp quantization performance gains

By

@reach_vb

–

24 November 2024 23h00

good reminder: I need to check my llama.cpp quants I suspect I’m leaving perf on the table.

→ View original post on X — @reach_vb,

24 November 2024
Llava o1: Open-Source Vision Language Model with CoT

By

@reach_vb

–

24 November 2024 21h02

Llava o1: https://
huggingface.co/Xkev/Llama-3.2
V-11B-cot
…

→ View original post on X — @reach_vb,

24 November 2024
Major Open Source LLM Releases: Pixtral, Tülu Compete With Claude

By

@reach_vb

–

24 November 2024 20h50

Massive week for Open AI/ ML: @MistralAI Pixtral & Instruct Large – ~123B, 128K context, multilingual, json + function calling & open weights @allen_ai Tülu 70B & 8B – competive with claude 3.5 haiku, beats all major open models like llama 3.1 70B, qwen 2.5 and nemotron Llava

→ View original post on X — @reach_vb,

24 November 2024
Open Weights and Science Drive AI Use Cases Forward

By

@reach_vb

–

24 November 2024 19h44

Many such use-cases being powered by open weights & science – so many low hanging fruits! https://t.co/yJMgujXcrG
— Vaibhav (VB) Srivastav (@reach_vb) 24 novembre 2024

Many such use-cases being powered by open weights & science – so many low hanging fruits!

→ View original post on X — @reach_vb,

24 November 2024
AI-Generated Artwork Headed to the Louvre Museum

By

@reach_vb

–

24 November 2024 16h18

Going to hang this in the Louvre!

→ View original post on X — @reach_vb,

24 November 2024
Apple releases ML-MobileClip open source code

By

@reach_vb

–

23 November 2024 17h18

Code: https://
github.com/apple/ml-mobil
eclip
…

→ View original post on X — @reach_vb,

23 November 2024
Apple Releases Fast CoreML Models for iPhone Performance

By

@reach_vb

–

23 November 2024 17h16

Pretty cool! @Apple released blazingly fast CoreML models AND an iOS app to run them on iPhone! ⚡

> S0 matches OpenAI's ViT-B/16 in zero-shot performance but is 4.8x faster and 2.8x smaller

> S2 outperforms SigLIP's ViT-B/16 in zero-shot accuracy, being 2.3x faster, 2.1x… pic.twitter.com/p9hPoajOtv
— Vaibhav (VB) Srivastav (@reach_vb) 23 novembre 2024

Pretty cool! @Apple released blazingly fast CoreML models AND an iOS app to run them on iPhone! > S0 matches OpenAI's ViT-B/16 in zero-shot performance but is 4.8x faster and 2.8x smaller > S2 outperforms SigLIP's ViT-B/16 in zero-shot accuracy, being 2.3x faster, 2.1x

→ View original post on X — @reach_vb,

23 November 2024
Apple Releases AIMv2 Vision Encoders Outperforming CLIP

By

@reach_vb

–

22 November 2024 8h54

New open release from @Apple – AIMv2 – large scale vision encoders > Outperforms CLIP and SigLIP on major multimodal understanding benchmarks
> Beats DINOv2 on open-vocabulary object detection and referring expression comprehension
> Strong recognition performance w/

→ View original post on X — @reach_vb,

22 November 2024
Bfloat16 vs Quantization: Performance Trade-offs in Model Deployment

By

@reach_vb

–

21 November 2024 23h48

Bfloat16 or nothing! FWIW – all the models deployed on Hugging Chat are bf16. Quants are good for local/ hobby use – however you always leave perf on the table.

→ View original post on X — @reach_vb,

21 November 2024
Frontier Model Introduction

By

@reach_vb

–

21 November 2024 21h02

Sure here’s my frontier model:

→ View original post on X — @reach_vb,

21 November 2024