Cycles/cycles/IncStrategies/README_BACKTESTER.md

# Incremental Backtester

A high-performance backtesting system for incremental trading strategies with multiprocessing support for parameter optimization.

## Overview

The Incremental Backtester provides a complete solution for testing incremental trading strategies:

- **IncTrader**: Manages a single strategy during backtesting
- **IncBacktester**: Orchestrates multiple traders and parameter optimization
- **Multiprocessing Support**: Parallel execution across CPU cores
- **Memory Efficient**: Bounded memory usage regardless of data length
- **Real-time Compatible**: Same interface as live trading systems

## Quick Start

### 1. Basic Single Strategy Backtest

```python
from cycles.IncStrategies import (
    IncBacktester, BacktestConfig, IncRandomStrategy
)

# Configure backtest
config = BacktestConfig(
    data_file="btc_1min_2023.csv",
    start_date="2023-01-01",
    end_date="2023-12-31",
    initial_usd=10000,
    stop_loss_pct=0.02,  # 2% stop loss
    take_profit_pct=0.05  # 5% take profit
)

# Create strategy
strategy = IncRandomStrategy(params={
    "timeframe": "15min",
    "entry_probability": 0.1,
    "exit_probability": 0.15
})

# Run backtest
backtester = IncBacktester(config)
results = backtester.run_single_strategy(strategy)

print(f"Profit: {results['profit_ratio']*100:.2f}%")
print(f"Trades: {results['n_trades']}")
print(f"Win Rate: {results['win_rate']*100:.1f}%")
```

### 2. Multiple Strategies

```python
strategies = [
    IncRandomStrategy(params={"timeframe": "15min"}),
    IncRandomStrategy(params={"timeframe": "30min"}),
    IncMetaTrendStrategy(params={"timeframe": "15min"})
]

results = backtester.run_multiple_strategies(strategies)

for result in results:
    print(f"{result['strategy_name']}: {result['profit_ratio']*100:.2f}%")
```

### 3. Parameter Optimization

```python
# Define parameter grids
strategy_param_grid = {
    "timeframe": ["15min", "30min", "1h"],
    "entry_probability": [0.05, 0.1, 0.15],
    "exit_probability": [0.1, 0.15, 0.2]
}

trader_param_grid = {
    "stop_loss_pct": [0.01, 0.02, 0.03],
    "take_profit_pct": [0.03, 0.05, 0.07]
}

# Run optimization (uses all CPU cores)
results = backtester.optimize_parameters(
    strategy_class=IncRandomStrategy,
    param_grid=strategy_param_grid,
    trader_param_grid=trader_param_grid,
    max_workers=8  # Use 8 CPU cores
)

# Get summary statistics
summary = backtester.get_summary_statistics(results)
print(f"Best profit: {summary['profit_ratio']['max']*100:.2f}%")

# Save results
backtester.save_results(results, "optimization_results.csv")
```

## Architecture

### IncTrader Class

Manages a single strategy during backtesting:

```python
trader = IncTrader(
    strategy=strategy,
    initial_usd=10000,
    params={
        "stop_loss_pct": 0.02,
        "take_profit_pct": 0.05
    }
)

# Process data sequentially
for timestamp, ohlcv_data in data_stream:
    trader.process_data_point(timestamp, ohlcv_data)

# Get results
results = trader.get_results()
```

**Key Features:**
- Position management (USD/coin balance)
- Trade execution based on strategy signals
- Stop loss and take profit handling
- Performance tracking and metrics
- Fee calculation using existing MarketFees

### IncBacktester Class

Orchestrates multiple traders and handles data loading:

```python
backtester = IncBacktester(config, storage)

# Single strategy
results = backtester.run_single_strategy(strategy)

# Multiple strategies
results = backtester.run_multiple_strategies(strategies)

# Parameter optimization
results = backtester.optimize_parameters(strategy_class, param_grid)
```

**Key Features:**
- Data loading using existing Storage class
- Multiprocessing for parameter optimization
- Result aggregation and analysis
- Summary statistics calculation
- CSV export functionality

### BacktestConfig Class

Configuration for backtesting runs:

```python
config = BacktestConfig(
    data_file="btc_1min_2023.csv",
    start_date="2023-01-01",
    end_date="2023-12-31",
    initial_usd=10000,
    timeframe="1min",
    
    # Trader parameters
    stop_loss_pct=0.02,
    take_profit_pct=0.05,
    
    # Performance settings
    max_workers=None,  # Auto-detect CPU cores
    chunk_size=1000
)
```

## Data Requirements

### Input Data Format

The backtester expects minute-level OHLCV data in CSV format:

```csv
timestamp,open,high,low,close,volume
1672531200,16625.1,16634.5,16620.0,16628.3,125.45
1672531260,16628.3,16635.2,16625.8,16631.7,98.32
...
```

**Requirements:**
- Timestamp column (Unix timestamp or datetime)
- OHLCV columns: open, high, low, close, volume
- Minute-level frequency (strategies handle timeframe aggregation)
- Sorted by timestamp (ascending)

### Data Loading

Uses the existing Storage class for data loading:

```python
from cycles.utils.storage import Storage

storage = Storage()
data = storage.load_data(
    "btc_1min_2023.csv",
    "2023-01-01",
    "2023-12-31"
)
```

## Performance Features

### Multiprocessing Support

Parameter optimization automatically distributes work across CPU cores:

```python
# Automatic CPU detection
results = backtester.optimize_parameters(strategy_class, param_grid)

# Manual worker count
results = backtester.optimize_parameters(
    strategy_class, param_grid, max_workers=4
)

# Single-threaded (for debugging)
results = backtester.optimize_parameters(
    strategy_class, param_grid, max_workers=1
)
```

### Memory Efficiency

- **Bounded Memory**: Strategy buffers have fixed size limits
- **Incremental Processing**: No need to load entire datasets into memory
- **Efficient Data Structures**: Optimized for sequential processing

### Performance Monitoring

Built-in performance tracking:

```python
results = backtester.run_single_strategy(strategy)

print(f"Backtest duration: {results['backtest_duration_seconds']:.2f}s")
print(f"Data points processed: {results['data_points_processed']}")
print(f"Processing rate: {results['data_points']/results['backtest_duration_seconds']:.0f} points/sec")
```

## Result Analysis

### Individual Results

Each backtest returns comprehensive metrics:

```python
{
    "strategy_name": "IncRandomStrategy",
    "strategy_params": {"timeframe": "15min", ...},
    "trader_params": {"stop_loss_pct": 0.02, ...},
    "initial_usd": 10000.0,
    "final_usd": 10250.0,
    "profit_ratio": 0.025,
    "n_trades": 15,
    "win_rate": 0.6,
    "max_drawdown": 0.08,
    "avg_trade": 0.0167,
    "total_fees_usd": 45.32,
    "trades": [...],  # Individual trade records
    "backtest_duration_seconds": 2.45
}
```

### Summary Statistics

For parameter optimization runs:

```python
summary = backtester.get_summary_statistics(results)

{
    "total_runs": 108,
    "successful_runs": 105,
    "failed_runs": 3,
    "profit_ratio": {
        "mean": 0.023,
        "std": 0.045,
        "min": -0.12,
        "max": 0.18,
        "median": 0.019
    },
    "best_run": {...},
    "worst_run": {...}
}
```

### Export Results

Save results to CSV for further analysis:

```python
backtester.save_results(results, "backtest_results.csv")
```

Output includes:
- Strategy and trader parameters
- Performance metrics
- Trade statistics
- Execution timing

## Integration with Existing System

### Compatibility

The incremental backtester integrates seamlessly with existing components:

- **Storage Class**: Uses existing data loading infrastructure
- **MarketFees**: Uses existing fee calculation
- **Strategy Interface**: Compatible with incremental strategies
- **Result Format**: Similar to existing Backtest class

### Migration from Original Backtester

```python
# Original backtester
from cycles.backtest import Backtest

# Incremental backtester
from cycles.IncStrategies import IncBacktester, BacktestConfig

# Similar interface, enhanced capabilities
config = BacktestConfig(...)
backtester = IncBacktester(config)
results = backtester.run_single_strategy(strategy)
```

## Testing

### Synthetic Data Testing

Test with synthetic data before using real market data:

```python
from cycles.IncStrategies.test_inc_backtester import main

# Run all tests
main()
```

### Unit Tests

Individual component testing:

```python
# Test IncTrader
from cycles.IncStrategies.test_inc_backtester import test_inc_trader
test_inc_trader()

# Test IncBacktester
from cycles.IncStrategies.test_inc_backtester import test_inc_backtester
test_inc_backtester()
```

## Examples

See `example_backtest.py` for comprehensive usage examples:

```python
from cycles.IncStrategies.example_backtest import (
    example_single_strategy_backtest,
    example_parameter_optimization,
    example_custom_analysis
)

# Run examples
example_single_strategy_backtest()
example_parameter_optimization()
```

## Best Practices

### 1. Data Preparation

- Ensure data quality (no gaps, correct format)
- Use appropriate date ranges for testing
- Consider market conditions in test periods

### 2. Parameter Optimization

- Start with small parameter grids for testing
- Use representative time periods
- Consider overfitting risks
- Validate results on out-of-sample data

### 3. Performance Optimization

- Use multiprocessing for large parameter grids
- Monitor memory usage for long backtests
- Profile bottlenecks for optimization

### 4. Result Validation

- Compare with original backtester for validation
- Check trade logic manually for small samples
- Verify fee calculations and position management

## Troubleshooting

### Common Issues

1. **Data Loading Errors**
   - Check file path and format
   - Verify date range availability
   - Ensure required columns exist

2. **Strategy Errors**
   - Check strategy initialization
   - Verify parameter validity
   - Monitor warmup period completion

3. **Performance Issues**
   - Reduce parameter grid size
   - Limit worker count for memory constraints
   - Use shorter time periods for testing

### Debug Mode

Enable detailed logging:

```python
import logging
logging.basicConfig(level=logging.DEBUG)

# Run with detailed output
results = backtester.run_single_strategy(strategy)
```

### Memory Monitoring

Monitor memory usage during optimization:

```python
import psutil
import os

process = psutil.Process(os.getpid())
print(f"Memory usage: {process.memory_info().rss / 1024 / 1024:.1f} MB")
```

## Future Enhancements

- **Live Trading Integration**: Direct connection to trading systems
- **Advanced Analytics**: Risk metrics, Sharpe ratio, etc.
- **Visualization**: Built-in plotting and analysis tools
- **Database Support**: Direct database connectivity
- **Strategy Combinations**: Multi-strategy portfolio testing

## Support

For issues and questions:
1. Check the test scripts for working examples
2. Review the TODO.md for known limitations
3. Examine the base strategy implementations
4. Use debug logging for detailed troubleshooting
ok, kind of incremental trading and backtester, but result not alligning 2025-05-27 16:51:43 +08:00			`# Incremental Backtester`

			`A high-performance backtesting system for incremental trading strategies with multiprocessing support for parameter optimization.`

			`## Overview`

			`The Incremental Backtester provides a complete solution for testing incremental trading strategies:`

			`- IncTrader: Manages a single strategy during backtesting`
			`- IncBacktester: Orchestrates multiple traders and parameter optimization`
			`- Multiprocessing Support: Parallel execution across CPU cores`
			`- Memory Efficient: Bounded memory usage regardless of data length`
			`- Real-time Compatible: Same interface as live trading systems`

			`## Quick Start`

			`### 1. Basic Single Strategy Backtest`

			```python
			`from cycles.IncStrategies import (`
			`IncBacktester, BacktestConfig, IncRandomStrategy`
			`)`

			`# Configure backtest`
			`config = BacktestConfig(`
			`data_file="btc_1min_2023.csv",`
			`start_date="2023-01-01",`
			`end_date="2023-12-31",`
			`initial_usd=10000,`
			`stop_loss_pct=0.02, # 2% stop loss`
			`take_profit_pct=0.05 # 5% take profit`
			`)`

			`# Create strategy`
			`strategy = IncRandomStrategy(params={`
			`"timeframe": "15min",`
			`"entry_probability": 0.1,`
			`"exit_probability": 0.15`
			`})`

			`# Run backtest`
			`backtester = IncBacktester(config)`
			`results = backtester.run_single_strategy(strategy)`

			`print(f"Profit: {results['profit_ratio']*100:.2f}%")`
			`print(f"Trades: {results['n_trades']}")`
			`print(f"Win Rate: {results['win_rate']*100:.1f}%")`
			```

			`### 2. Multiple Strategies`

			```python
			`strategies = [`
			`IncRandomStrategy(params={"timeframe": "15min"}),`
			`IncRandomStrategy(params={"timeframe": "30min"}),`
			`IncMetaTrendStrategy(params={"timeframe": "15min"})`
			`]`

			`results = backtester.run_multiple_strategies(strategies)`

			`for result in results:`
			`print(f"{result['strategy_name']}: {result['profit_ratio']*100:.2f}%")`
			```

			`### 3. Parameter Optimization`

			```python
			`# Define parameter grids`
			`strategy_param_grid = {`
			`"timeframe": ["15min", "30min", "1h"],`
			`"entry_probability": [0.05, 0.1, 0.15],`
			`"exit_probability": [0.1, 0.15, 0.2]`
			`}`

			`trader_param_grid = {`
			`"stop_loss_pct": [0.01, 0.02, 0.03],`
			`"take_profit_pct": [0.03, 0.05, 0.07]`
			`}`

			`# Run optimization (uses all CPU cores)`
			`results = backtester.optimize_parameters(`
			`strategy_class=IncRandomStrategy,`
			`param_grid=strategy_param_grid,`
			`trader_param_grid=trader_param_grid,`
			`max_workers=8 # Use 8 CPU cores`
			`)`

			`# Get summary statistics`
			`summary = backtester.get_summary_statistics(results)`
			`print(f"Best profit: {summary['profit_ratio']['max']*100:.2f}%")`

			`# Save results`
			`backtester.save_results(results, "optimization_results.csv")`
			```

			`## Architecture`

			`### IncTrader Class`

			`Manages a single strategy during backtesting:`

			```python
			`trader = IncTrader(`
			`strategy=strategy,`
			`initial_usd=10000,`
			`params={`
			`"stop_loss_pct": 0.02,`
			`"take_profit_pct": 0.05`
			`}`
			`)`

			`# Process data sequentially`
			`for timestamp, ohlcv_data in data_stream:`
			`trader.process_data_point(timestamp, ohlcv_data)`

			`# Get results`
			`results = trader.get_results()`
			```

			`Key Features:`
			`- Position management (USD/coin balance)`
			`- Trade execution based on strategy signals`
			`- Stop loss and take profit handling`
			`- Performance tracking and metrics`
			`- Fee calculation using existing MarketFees`

			`### IncBacktester Class`

			`Orchestrates multiple traders and handles data loading:`

			```python
			`backtester = IncBacktester(config, storage)`

			`# Single strategy`
			`results = backtester.run_single_strategy(strategy)`

			`# Multiple strategies`
			`results = backtester.run_multiple_strategies(strategies)`

			`# Parameter optimization`
			`results = backtester.optimize_parameters(strategy_class, param_grid)`
			```

			`Key Features:`
			`- Data loading using existing Storage class`
			`- Multiprocessing for parameter optimization`
			`- Result aggregation and analysis`
			`- Summary statistics calculation`
			`- CSV export functionality`

			`### BacktestConfig Class`

			`Configuration for backtesting runs:`

			```python
			`config = BacktestConfig(`
			`data_file="btc_1min_2023.csv",`
			`start_date="2023-01-01",`
			`end_date="2023-12-31",`
			`initial_usd=10000,`
			`timeframe="1min",`

			`# Trader parameters`
			`stop_loss_pct=0.02,`
			`take_profit_pct=0.05,`

			`# Performance settings`
			`max_workers=None, # Auto-detect CPU cores`
			`chunk_size=1000`
			`)`
			```

			`## Data Requirements`

			`### Input Data Format`

			`The backtester expects minute-level OHLCV data in CSV format:`

			```csv
			`timestamp,open,high,low,close,volume`
			`1672531200,16625.1,16634.5,16620.0,16628.3,125.45`
			`1672531260,16628.3,16635.2,16625.8,16631.7,98.32`
			`...`
			```

			`Requirements:`
			`- Timestamp column (Unix timestamp or datetime)`
			`- OHLCV columns: open, high, low, close, volume`
			`- Minute-level frequency (strategies handle timeframe aggregation)`
			`- Sorted by timestamp (ascending)`

			`### Data Loading`

			`Uses the existing Storage class for data loading:`

			```python
			`from cycles.utils.storage import Storage`

			`storage = Storage()`
			`data = storage.load_data(`
			`"btc_1min_2023.csv",`
			`"2023-01-01",`
			`"2023-12-31"`
			`)`
			```

			`## Performance Features`

			`### Multiprocessing Support`

			`Parameter optimization automatically distributes work across CPU cores:`

			```python
			`# Automatic CPU detection`
			`results = backtester.optimize_parameters(strategy_class, param_grid)`

			`# Manual worker count`
			`results = backtester.optimize_parameters(`
			`strategy_class, param_grid, max_workers=4`
			`)`

			`# Single-threaded (for debugging)`
			`results = backtester.optimize_parameters(`
			`strategy_class, param_grid, max_workers=1`
			`)`
			```

			`### Memory Efficiency`

			`- Bounded Memory: Strategy buffers have fixed size limits`
			`- Incremental Processing: No need to load entire datasets into memory`
			`- Efficient Data Structures: Optimized for sequential processing`

			`### Performance Monitoring`

			`Built-in performance tracking:`

			```python
			`results = backtester.run_single_strategy(strategy)`

			`print(f"Backtest duration: {results['backtest_duration_seconds']:.2f}s")`
			`print(f"Data points processed: {results['data_points_processed']}")`
			`print(f"Processing rate: {results['data_points']/results['backtest_duration_seconds']:.0f} points/sec")`
			```

			`## Result Analysis`

			`### Individual Results`

			`Each backtest returns comprehensive metrics:`

			```python
			`{`
			`"strategy_name": "IncRandomStrategy",`
			`"strategy_params": {"timeframe": "15min", ...},`
			`"trader_params": {"stop_loss_pct": 0.02, ...},`
			`"initial_usd": 10000.0,`
			`"final_usd": 10250.0,`
			`"profit_ratio": 0.025,`
			`"n_trades": 15,`
			`"win_rate": 0.6,`
			`"max_drawdown": 0.08,`
			`"avg_trade": 0.0167,`
			`"total_fees_usd": 45.32,`
			`"trades": [...], # Individual trade records`
			`"backtest_duration_seconds": 2.45`
			`}`
			```

			`### Summary Statistics`

			`For parameter optimization runs:`

			```python
			`summary = backtester.get_summary_statistics(results)`

			`{`
			`"total_runs": 108,`
			`"successful_runs": 105,`
			`"failed_runs": 3,`
			`"profit_ratio": {`
			`"mean": 0.023,`
			`"std": 0.045,`
			`"min": -0.12,`
			`"max": 0.18,`
			`"median": 0.019`
			`},`
			`"best_run": {...},`
			`"worst_run": {...}`
			`}`
			```

			`### Export Results`

			`Save results to CSV for further analysis:`

			```python
			`backtester.save_results(results, "backtest_results.csv")`
			```

			`Output includes:`
			`- Strategy and trader parameters`
			`- Performance metrics`
			`- Trade statistics`
			`- Execution timing`

			`## Integration with Existing System`

			`### Compatibility`

			`The incremental backtester integrates seamlessly with existing components:`

			`- Storage Class: Uses existing data loading infrastructure`
			`- MarketFees: Uses existing fee calculation`
			`- Strategy Interface: Compatible with incremental strategies`
			`- Result Format: Similar to existing Backtest class`

			`### Migration from Original Backtester`

			```python
			`# Original backtester`
			`from cycles.backtest import Backtest`

			`# Incremental backtester`
			`from cycles.IncStrategies import IncBacktester, BacktestConfig`

			`# Similar interface, enhanced capabilities`
			`config = BacktestConfig(...)`
			`backtester = IncBacktester(config)`
			`results = backtester.run_single_strategy(strategy)`
			```

			`## Testing`

			`### Synthetic Data Testing`

			`Test with synthetic data before using real market data:`

			```python
			`from cycles.IncStrategies.test_inc_backtester import main`

			`# Run all tests`
			`main()`
			```

			`### Unit Tests`

			`Individual component testing:`

			```python
			`# Test IncTrader`
			`from cycles.IncStrategies.test_inc_backtester import test_inc_trader`
			`test_inc_trader()`

			`# Test IncBacktester`
			`from cycles.IncStrategies.test_inc_backtester import test_inc_backtester`
			`test_inc_backtester()`
			```

			`## Examples`

			See `example_backtest.py` for comprehensive usage examples:

			```python
			`from cycles.IncStrategies.example_backtest import (`
			`example_single_strategy_backtest,`
			`example_parameter_optimization,`
			`example_custom_analysis`
			`)`

			`# Run examples`
			`example_single_strategy_backtest()`
			`example_parameter_optimization()`
			```

			`## Best Practices`

			`### 1. Data Preparation`

			`- Ensure data quality (no gaps, correct format)`
			`- Use appropriate date ranges for testing`
			`- Consider market conditions in test periods`

			`### 2. Parameter Optimization`

			`- Start with small parameter grids for testing`
			`- Use representative time periods`
			`- Consider overfitting risks`
			`- Validate results on out-of-sample data`

			`### 3. Performance Optimization`

			`- Use multiprocessing for large parameter grids`
			`- Monitor memory usage for long backtests`
			`- Profile bottlenecks for optimization`

			`### 4. Result Validation`

			`- Compare with original backtester for validation`
			`- Check trade logic manually for small samples`
			`- Verify fee calculations and position management`

			`## Troubleshooting`

			`### Common Issues`

			`1. Data Loading Errors`
			`- Check file path and format`
			`- Verify date range availability`
			`- Ensure required columns exist`

			`2. Strategy Errors`
			`- Check strategy initialization`
			`- Verify parameter validity`
			`- Monitor warmup period completion`

			`3. Performance Issues`
			`- Reduce parameter grid size`
			`- Limit worker count for memory constraints`
			`- Use shorter time periods for testing`

			`### Debug Mode`

			`Enable detailed logging:`

			```python
			`import logging`
			`logging.basicConfig(level=logging.DEBUG)`

			`# Run with detailed output`
			`results = backtester.run_single_strategy(strategy)`
			```

			`### Memory Monitoring`

			`Monitor memory usage during optimization:`

			```python
			`import psutil`
			`import os`

			`process = psutil.Process(os.getpid())`
			`print(f"Memory usage: {process.memory_info().rss / 1024 / 1024:.1f} MB")`
			```

			`## Future Enhancements`

			`- Live Trading Integration: Direct connection to trading systems`
			`- Advanced Analytics: Risk metrics, Sharpe ratio, etc.`
			`- Visualization: Built-in plotting and analysis tools`
			`- Database Support: Direct database connectivity`
			`- Strategy Combinations: Multi-strategy portfolio testing`

			`## Support`

			`For issues and questions:`
			`1. Check the test scripts for working examples`
			`2. Review the TODO.md for known limitations`
			`3. Examine the base strategy implementations`
			`4. Use debug logging for detailed troubleshooting`