Qwen on blog.byMAR.CO

Qwen on blog.byMAR.CO https://blog.bymar.co/tags/qwen/ Recent content in Qwen on blog.byMAR.CO Hugo -- 0.161.1 en-us Thu, 07 May 2026 02:10:00 -0400 Speculative Decoding Is Finally Useful for Local LLMs https://blog.bymar.co/posts/speculative-decoding-local-llms-2026/ Thu, 07 May 2026 02:10:00 -0400 https://blog.bymar.co/posts/speculative-decoding-local-llms-2026/ A practical field guide to speculative decoding for local LLMs, covering ngram speculation, MTP heads, TurboQuant, Qwen3.6, llama.cpp, vLLM, and the current LocalLLaMA field reports.