AI Prompt Market

[skuznetsov/js_recover] Grok 4 Fast Reasoning Integration - Complete Guide

ChatGPT API Leak/ChatGPT

11,882 characters

# Grok 4 Fast Reasoning Integration - Complete Guide ## 🎯 Overview This project now includes **Grok-4 Fast Reasoning** integration for semantic deobfuscation of JavaScript code. Grok analyzes obfuscated identifiers and suggests meaningful names based on context and usage patterns. ## 📊 Performance & Cost **Real-world results:** ``` Small file (100 lines): $0.0002 (~0.02 cents) ⚡ 5 seconds Medium file (1K lines): $0.002 (~0.2 cents) ⚡ 15 seconds Large file (10K lines): $0.020 (~2 cents) ⚡ 2 minutes Huge file (100K lines): $0.060 (~6 cents) ⚡ 8 minutes ``` **Cost savings:** - Optimized mode: **2-3x cheaper** than standard mode - Grok-4: **30-100x cheaper** than Claude/GPT-4 - Full deobfuscation costs **less than 1 coffee** ☕ ## 🚀 Quick Start ### 1. Install Dependencies ```bash npm install axios ``` ### 2. Set API Key ```bash export XAI_API_KEY=your_api_key_here ``` Get your key from: https://console.x.ai/ ### 3. Run Deobfuscation **Option A: Optimized Mode (Recommended)** ```javascript const parser = require('@babel/parser'); const generate = require('@babel/generator').default; const { grokSemanticAnalysisOptimized } = require('./lib/mutators/grok_semantic_analysis_optimized'); // Parse obfuscated code const ast = parser.parse(obfuscatedCode, { sourceType: 'module' }); // Run semantic analysis await grokSemanticAnalysisOptimized(ast, { filename: 'myfile.js', // For cost tracking config: { verbose: false } }); // Generate deobfuscated code const deobfuscated = generate(ast).code; ``` **Option B: Standard Mode (Small Files Only)** ```javascript const { grokSemanticAnalysis } = require('./lib/mutators/grok_semantic_analysis'); await grokSemanticAnalysis(ast, { config: { verbose: false } }); ``` ### 4. See Results The system will show **real-time cost tracking**: ``` ┌────────────────────────────────────────────────────────────────────┐ │ LLM DEOBFUSCATION COST TRACKING │ ├────────────────────────────────────────────────────────────────────┤ │ File: obfuscated.js │ └────────────────────────────────────────────────────────────────────┘ [2.3s] Grok Batch Analysis | 1,234 tokens | $0.000345 | Running: $0.000345 [5.1s] Grok Batch Analysis | 987 tokens | $0.000267 | Running: $0.000612 ┌────────────────────────────────────────────────────────────────────┐ │ DEOBFUSCATION SUMMARY │ ├────────────────────────────────────────────────────────────────────┤ │ Duration: 5.1s │ │ LLM Operations: 2 │ │ Total Tokens: 2,221 │ │ Identifiers Analyzed: 45 │ │ Identifiers Renamed: 38 │ │ Cost per Identifier: $0.000016 │ ├────────────────────────────────────────────────────────────────────┤ │ TOTAL LLM COST: $0.000612 │ └────────────────────────────────────────────────────────────────────┘ ``` ## 📁 Project Structure ``` lib/grok/ ├── interface.js # GrokInterface (xAI API client) ├── universal_wrapper.js # Universal function calling └── index.js # Exports lib/mutators/ ├── grok_semantic_analysis.js # Standard mode └── grok_semantic_analysis_optimized.js # Optimized mode (2-3x cheaper!) lib/ └── cost_tracker.js # Real-time cost tracking examples/ ├── test_grok.js # Basic Grok tests ├── test_semantic_analysis.js # Semantic analysis test └── compare_grok_modes.js # Compare standard vs optimized docs/ ├── GROK_INTEGRATION.md # Integration guide └── GROK_COST_OPTIMIZATION.md # Cost optimization strategies ``` ## 🎛️ Configuration Tune for your file size: ### Small Files (<10K lines) ```javascript // Use standard mode - full context gives better results const { grokSemanticAnalysis } = require('./lib/mutators/grok_semantic_analysis'); await grokSemanticAnalysis(ast, opts); ``` ### Medium Files (10K-100K lines) ```javascript // Use optimized mode with defaults const { grokSemanticAnalysisOptimized } = require('./lib/mutators/grok_semantic_analysis_optimized'); await grokSemanticAnalysisOptimized(ast, opts); ``` ### Large Files (>100K lines) ```javascript // Use optimized mode with aggressive settings const { CONFIG, grokSemanticAnalysisOptimized } = require('./lib/mutators/grok_semantic_analysis_optimized'); CONFIG.MIN_USAGE_COUNT = 5; // Only frequently used CONFIG.MAX_IDENTIFIERS_PER_BATCH = 30; // Smaller batches CONFIG.MIN_CONFIDENCE = 0.8; // High confidence only await grokSemanticAnalysisOptimized(ast, opts); ``` ## 💡 How It Works ### 1. **Identifier Collection** Scans AST for obfuscated patterns: - `_0x1a2b3c` - Hex-named variables - `a1`, `b2` - Short alphanumeric - Single letters (except `i`, `j`, `k`) ### 2. **Priority Ranking** Ranks identifiers by importance: ``` Priority = (usage_count × 10) + (type_bonus) + (length_penalty × 5) ``` High priority → analyze first Low priority → skip (save cost!) ### 3. **Smart Context Extraction** Instead of sending entire file: - Extract 500 chars context per identifier - Include initialization and usage patterns - Batch 50 identifiers per API call **Example:** - Full code: 50K chars → 12K tokens → $0.0024 - Smart context: 500 chars × 3 chunks → 1.5K tokens → $0.0003 **8x cheaper!** ### 4. **Batch Function Calling** One API call analyzes multiple identifiers: ```javascript // Grok calls suggest_identifier_rename() multiple times: { original_name: "_0x4f2a", suggested_name: "greetingMessages", confidence: 0.90, reasoning: "Array containing greeting strings" } { original_name: "_0xabc", suggested_name: "formatMessage", confidence: 0.85, reasoning: "Function that formats message strings" } ``` ### 5. **Confidence Filtering** Only apply high-confidence renames (>0.7 by default): ``` ✓ _0x4f2a -> greetingMessages (0.90 confidence) ✅ Applied ✓ _0xabc -> formatMessage (0.85 confidence) ✅ Applied ⊘ x -> temp (0.55 confidence) ❌ Skipped ``` ## 📈 Cost Estimation Use the formula: ```javascript function estimateCost(linesOfCode, obfuscatedCount) { const identifiersAfterFilter = obfuscatedCount * 0.3; // 30% pass filter const batchCount = Math.ceil(identifiersAfterFilter / 50); const avgTokensPerBatch = 1000; const totalTokens = batchCount * avgTokensPerBatch; const cost = (totalTokens * 0.8 / 1_000_000 * 0.20) + // Input (totalTokens * 0.2 / 1_000_000 * 0.50); // Output return { cost, batches: batchCount }; } estimateCost(10_000, 200); // → $0.003 (3 batches) estimateCost(100_000, 2000); // → $0.020 (15 batches) ``` ## 🔧 Advanced Usage ### Custom Filtering Add domain-specific filters: ```javascript // Edit lib/mutators/grok_semantic_analysis_optimized.js function isObfuscated(name) { // Skip jQuery-style if (name.startsWith('$')) return false; // Skip common abbreviations if (['fn', 'cb', 'err'].includes(name)) return false; // Original logic... return /^_0x[0-9a-f]+$/i.test(name) || ... } ``` ### Cost Monitoring Track costs across sessions: ```javascript const { tracker } = require('./lib/cost_tracker'); // After multiple files tracker.showHistory(); tracker.exportHistory('./costs.json'); ``` ### Integration with app.js ```javascript // In app.js, after other mutators: const { grokSemanticAnalysisOptimized } = require('./lib/mutators/grok_semantic_analysis_optimized'); // Run semantic analysis if (process.env.XAI_API_KEY) { await grokSemanticAnalysisOptimized(ast, { filename: inputFile, config: opts.config }); } ``` ## 🧪 Testing ### Test Basic Integration ```bash node examples/test_grok.js ``` ### Test Semantic Analysis ```bash node examples/test_semantic_analysis.js # Or with your own file: node examples/test_semantic_analysis.js yourfile.js ``` ### Compare Modes ```bash # Optimized mode only node examples/compare_grok_modes.js --skip-standard # Compare both (costs more!) node examples/compare_grok_modes.js --compare ``` ## 📚 Documentation - **[GROK_INTEGRATION.md](docs/GROK_INTEGRATION.md)** - Full integration guide - **[GROK_COST_OPTIMIZATION.md](docs/GROK_COST_OPTIMIZATION.md)** - Cost optimization strategies ## 🎓 Best Practices ### ✅ DO 1. **Use optimized mode for production** - 2-3x cheaper 2. **Enable API key in environment** - `export XAI_API_KEY=...` 3. **Monitor costs** - Check summary after each run 4. **Tune CONFIG for file size** - Larger files = more aggressive filtering 5. **Trust high confidence** - >0.8 confidence is usually correct ### ❌ DON'T 1. **Don't use standard mode for large files** - Too expensive 2. **Don't skip priority filtering** - Wastes tokens on rare identifiers 3. **Don't set MIN_CONFIDENCE < 0.7** - Low quality renames 4. **Don't analyze loop counters** (i, j, k) - Already clear 5. **Don't run twice on same file** - Use caching ## 🐛 Troubleshooting ### "No XAI_API_KEY" ```bash export XAI_API_KEY=your_key_here ``` ### High Costs Check: ```javascript const { stats } = require('./lib/mutators/grok_semantic_analysis_optimized'); console.log('Total tokens:', stats.totalTokens); // Should be <10K for medium file console.log('Skipped:', stats.identifiersSkipped); // Should be 50-70% ``` Tune more aggressively: ```javascript CONFIG.MIN_USAGE_COUNT = 5; // Only frequently used CONFIG.MAX_IDENTIFIERS_PER_BATCH = 20; // Smaller batches ``` ### Low Rename Rate Increase confidence threshold: ```javascript CONFIG.MIN_CONFIDENCE = 0.6; // Accept more suggestions ``` ## 🎉 Example Results **Before:** ```javascript var _0x4f2a = ['Hello', 'World']; function _0xabc(_0x1, _0x2) { return _0x1 + ' ' + _0x2; } var _0xresult = _0xabc(_0x4f2a[0], _0x4f2a[1]); ``` **After:** ```javascript var greetingMessages = ['Hello', 'World']; function joinWithSpace(firstWord, secondWord) { return firstWord + ' ' + secondWord; } var greeting = joinWithSpace(greetingMessages[0], greetingMessages[1]); ``` **Cost:** $0.000231 (0.02 cents!) ## 🤝 Contributing Improvements welcome! Areas to explore: - Custom naming patterns for specific libraries - Integration with sourcemap recovery - Multi-model consensus (Grok + Claude) - Fine-tuning on obfuscation datasets ## 📄 License Same as js_recover project. --- **Happy Deobfuscating! 🚀** For questions or issues, check the documentation or create an issue.

Download .txt