Name: bhenrym14/airoboros-7b-gpt4-1.4.1-lxctx-PI-16384-fp16 API
Brand: Featherless.ai
Price: 10.00 USD
Availability: InStock
Author: bhenrym14

Model Overview

This model, airoboros-7b-gpt4-1.4.1-lxctx-PI-16384-fp16, is a 7 billion parameter Llama-based QLoRA fine-tune by bhenrym14. It significantly extends the context window to 16384 tokens through RoPE Scaled Embeddings, building upon Jon Durbin's Airoboros 7B GPT4 1.4. The base Llama-7b model underwent an additional 150 steps of pretraining on 16384-length sequences from the Pile dataset to stabilize performance at longer contexts.

Key Capabilities

Extended Context Window: Achieves a 16384-token context length, making it suitable for processing and generating long texts.
Improved Long-Context Perplexity: Demonstrates lower perplexity at 4096, 8192, and 16384 tokens compared to the original Airoboros 7B GPT4 1.4, indicating better understanding and generation quality for longer inputs.
Context-Obedient Question Answering: Trained to strictly adhere to provided context for answers, minimizing hallucinations.
Code Generation: Capable of generating code in multiple languages, including a "PLAINFORMAT" option for code-only output.
Multi-turn Conversations & Roleplay: Enhanced for complex conversational flows and character-specific interactions.

Good For

Long-form content analysis: Summarizing, extracting information, or answering questions from extensive documents.
Complex coding tasks: Generating multi-part code solutions or applications based on detailed requirements.
Advanced conversational AI: Building chatbots that maintain context over long dialogues or engage in intricate roleplay scenarios.
Research and experimentation: Ideal for exploring the capabilities of LLMs with significantly extended context windows.

Overview

Model Overview

Key Capabilities

Good For

Full Model Card (README)