Search Results - RepositoryStats

106

2.8k

mit

23

A native macOS app that allows users to chat with a local LLM that can respond with information from files, folders and websites on your Mac without installing any other software. Powered by llama.cpp...

ai llm qwq rag qwen llama macos qwen3 swift aichat gemma3 llama4 chatbot qwq-32b swiftui deepseek ai-agents agentic-ai deepseek-r1

Created 2024-10-09

446 commits to main branch, last one a day ago

OllamaR adysec

125

134

unknown

129

Ollama负载均衡服务器 | 一款高性能、易配置的开源负载均衡服务器，优化Ollama负载。它能够帮助您提高应用程序的可用性和响应速度，同时确保系统资源的有效利用。

ai gpt llm qwq embed ollama embedded embeddings ollama-api ollama-app deepseek-r1 ollama-chat ollama-client

Created 2025-03-10

8 commits to main branch, last one about a month ago

grps_trtllm NetEase-Media

8

130

apache-2.0

4

Higher performance OpenAI LLM service than vLLM serve: A pure C++ high-performance OpenAI LLM service implemented with GPRS+TensorRT-LLM+Tokenizers.cpp, supporting chat and function call, AI agents, d...

llm phi qwq qwen2 llama3 olmocr openai chatglm ai-agent internvl qwen2-vl janus-pro minicpm-v deepseek-r1 internvideo llama-index multi-modal tensorrt-llm function-call

Created 2024-08-21

158 commits to master branch, last one 8 days ago

hogwild_llm eqimp

4

94

apache-2.0

9

Official PyTorch implementation for Hogwild! Inference: Parallel LLM Generation with a Concurrent Attention Cache

llm nlp qwq reasoning multi-agents llms-reasoning

Created 2025-04-08

25 commits to main branch, last one a day ago

easy-model-deployer aws-samples

5

35

mit-0

12

A user-friendly Command-line/SDK tool that makes it quickly and easier to deploy open-source LLMs on AWS

ec2 ecs qwq vllm gemma3 ollama qwen2-5 qwq-32b deepseek internlm2 langchain sagemaker deepseek-r1 huggingface inferentia-2 comfyui-workflow large-language-model openai-compatible-api

Created 2025-01-25

103 commits to main branch, last one a day ago

BoT zihao-ai

0

28

unknown

1

🔥🔥🔥Breaking long thought processes of o1-like LLMs, such as DeepSeek-R1, QwQ

qwq deepseek ai-agents deepseek-r1 backdoor-attacks chain-of-thought large-language-models reasoning-language-models

Created 2025-02-17

17 commits to main branch, last one about a month ago