4.0 - 3.0 Implement strategy analysis tables and repository for backtesting

- Added `StrategyRun` and `StrategySignal` models to track strategy execution sessions and generated signals, respectively, ensuring a clear separation from live trading data. - Introduced `StrategyRepository` for managing database operations related to strategy runs and signals, including methods for creating, updating, and retrieving strategy data. - Updated `DatabaseOperations` to integrate the new repository, enhancing the overall architecture and maintaining consistency with existing database access patterns. - Enhanced documentation to reflect the new database schema and repository functionalities, ensuring clarity for future development and usage. These changes establish a robust foundation for strategy analysis and backtesting, aligning with project goals for modularity, performance, and maintainability.
2025-06-12 15:29:14 +08:00
parent d34da789ec
commit f09864d61b
7 changed files with 529 additions and 29 deletions
--- a/database/models.py
+++ b/database/models.py
@@ -241,6 +241,72 @@ class BotPerformance(Base):
        return f"<BotPerformance(Bot {self.bot_id} - Value: {self.total_value} - Win Rate: {self.win_rate:.2f}%)>"


+class StrategyRun(Base):
+    """Strategy Execution Sessions - For tracking strategy backtesting and analysis runs"""
+    __tablename__ = 'strategy_runs'
+    
+    id = Column(Integer, primary_key=True)
+    strategy_name = Column(String(100), nullable=False)
+    symbol = Column(String(20), nullable=False)
+    timeframe = Column(String(5), nullable=False)
+    start_time = Column(DateTime(timezone=True), nullable=False)
+    end_time = Column(DateTime(timezone=True))
+    status = Column(String(20), nullable=False, default='running')  # running, completed, failed
+    config = Column(JSONB)  # Strategy configuration parameters
+    run_metadata = Column(JSONB)  # Run metadata (backtesting params, etc.)
+    total_signals = Column(Integer, default=0)
+    created_at = Column(DateTime(timezone=True), default=func.now())
+    updated_at = Column(DateTime(timezone=True), default=func.now(), onupdate=func.now())
+    
+    # Relationships
+    strategy_signals = relationship("StrategySignal", back_populates="strategy_run", cascade="all, delete-orphan")
+    
+    __table_args__ = (
+        CheckConstraint("status IN ('running', 'completed', 'failed')", name='chk_strategy_run_status'),
+        Index('idx_strategy_runs_strategy_time', 'strategy_name', 'start_time'),
+        Index('idx_strategy_runs_symbol', 'symbol'),
+        Index('idx_strategy_runs_status', 'status'),
+        Index('idx_strategy_runs_timeframe', 'timeframe'),
+    )
+    
+    def __repr__(self):
+        return f"<StrategyRun({self.strategy_name} - {self.symbol} - {self.status})>"
+
+
+class StrategySignal(Base):
+    """Strategy Analysis Signals - Generated by strategies for analysis and backtesting (separate from bot signals)"""
+    __tablename__ = 'strategy_signals'
+    
+    id = Column(Integer, primary_key=True)
+    run_id = Column(Integer, ForeignKey('strategy_runs.id', ondelete='CASCADE'), nullable=False)
+    strategy_name = Column(String(100), nullable=False)
+    strategy_config = Column(JSONB)  # Strategy configuration used for this signal
+    symbol = Column(String(20), nullable=False)
+    timeframe = Column(String(5), nullable=False)
+    timestamp = Column(DateTime(timezone=True), nullable=False)
+    signal_type = Column(String(20), nullable=False)  # buy, sell, hold, entry_long, exit_long, etc.
+    price = Column(DECIMAL(18, 8))
+    confidence = Column(DECIMAL(5, 4))  # 0.0000 to 1.0000
+    signal_metadata = Column(JSONB)  # Additional signal metadata (indicator values, etc.)
+    created_at = Column(DateTime(timezone=True), default=func.now())
+    
+    # Relationships
+    strategy_run = relationship("StrategyRun", back_populates="strategy_signals")
+    
+    __table_args__ = (
+        CheckConstraint("signal_type IN ('buy', 'sell', 'hold', 'entry_long', 'exit_long', 'entry_short', 'exit_short', 'stop_loss', 'take_profit')", name='chk_strategy_signal_type'),
+        CheckConstraint("confidence >= 0 AND confidence <= 1", name='chk_strategy_confidence'),
+        Index('idx_strategy_signals_strategy_time', 'strategy_name', 'timestamp'),
+        Index('idx_strategy_signals_run_time', 'run_id', 'timestamp'),
+        Index('idx_strategy_signals_symbol_timeframe', 'symbol', 'timeframe'),
+        Index('idx_strategy_signals_type', 'signal_type'),
+        Index('idx_strategy_signals_timestamp', 'timestamp'),
+    )
+    
+    def __repr__(self):
+        return f"<StrategySignal({self.strategy_name} - {self.signal_type} - {self.price} - {self.confidence})>"
+
+
 # Reference tables for system configuration
 class SupportedTimeframe(Base):
    """Supported timeframes configuration"""
@@ -277,6 +343,8 @@ def get_model_by_table_name(table_name: str):
        'signals': Signal,
        'trades': Trade,
        'bot_performance': BotPerformance,
+        'strategy_runs': StrategyRun,
+        'strategy_signals': StrategySignal,
        'supported_timeframes': SupportedTimeframe,
        'supported_exchanges': SupportedExchange,
    }
--- a/database/operations.py
+++ b/database/operations.py
@@ -14,6 +14,7 @@ from .repositories import (
    BotRepository,
    MarketDataRepository,
    RawTradeRepository,
+    StrategyRepository,
    DatabaseOperationError,
 )

@@ -33,6 +34,7 @@ class DatabaseOperations:
        self.bots = BotRepository(logger)
        self.market_data = MarketDataRepository(logger)
        self.raw_trades = RawTradeRepository(logger)
+        self.strategies = StrategyRepository(logger)
    
    def health_check(self) -> bool:
        """
@@ -64,7 +66,8 @@ class DatabaseOperations:
                'repositories': {
                    'bots': 'BotRepository',
                    'market_data': 'MarketDataRepository',
-                    'raw_trades': 'RawTradeRepository'
+                    'raw_trades': 'RawTradeRepository',
+                    'strategies': 'StrategyRepository'
                }
            }
            
@@ -73,6 +76,8 @@ class DatabaseOperations:
                stats['bot_count'] = session.execute(text("SELECT COUNT(*) FROM bots")).scalar_one()
                stats['candle_count'] = session.execute(text("SELECT COUNT(*) FROM market_data")).scalar_one()
                stats['raw_trade_count'] = session.execute(text("SELECT COUNT(*) FROM raw_trades")).scalar_one()
+                stats['strategy_runs_count'] = session.execute(text("SELECT COUNT(*) FROM strategy_runs")).scalar_one()
+                stats['strategy_signals_count'] = session.execute(text("SELECT COUNT(*) FROM strategy_signals")).scalar_one()
            
            return stats
            
--- a/database/repositories/init.py
+++ b/database/repositories/init.py
@@ -5,6 +5,7 @@ from .base_repository import BaseRepository, DatabaseOperationError
 from .bot_repository import BotRepository
 from .market_data_repository import MarketDataRepository
 from .raw_trade_repository import RawTradeRepository
+from .strategy_repository import StrategyRepository

 __all__ = [
    "BaseRepository",
@@ -12,4 +13,5 @@ __all__ = [
    "BotRepository",
    "MarketDataRepository",
    "RawTradeRepository",
+    "StrategyRepository",
 ] 
--- a/database/repositories/strategy_repository.py
+++ b/database/repositories/strategy_repository.py
@@ -0,0 +1,252 @@
+"""Repository for strategy_signals and strategy_runs table operations."""
+
+from datetime import datetime, timedelta
+from typing import Dict, Any, Optional, List
+from decimal import Decimal
+
+from sqlalchemy import desc, and_, func
+from sqlalchemy.orm import joinedload
+
+from ..models import StrategySignal, StrategyRun
+from strategies.data_types import StrategySignal as StrategySignalDataType, StrategyResult
+from .base_repository import BaseRepository, DatabaseOperationError
+
+
+class StrategyRepository(BaseRepository):
+    """Repository for strategy_signals and strategy_runs table operations."""
+    
+    # Strategy Run Operations
+    def create_strategy_run(self, run_data: Dict[str, Any]) -> StrategyRun:
+        """
+        Create a new strategy run session.
+        
+        Args:
+            run_data: Dictionary containing run information (strategy_name, symbol, timeframe, etc.)
+            
+        Returns:
+            The newly created StrategyRun object
+        """
+        try:
+            with self.get_session() as session:
+                new_run = StrategyRun(**run_data)
+                session.add(new_run)
+                session.commit()
+                session.refresh(new_run)
+                self.log_info(f"Created strategy run: {new_run.strategy_name} for {new_run.symbol}")
+                return new_run
+        except Exception as e:
+            self.log_error(f"Error creating strategy run: {e}")
+            raise DatabaseOperationError(f"Failed to create strategy run: {e}")
+    
+    def get_strategy_run_by_id(self, run_id: int) -> Optional[StrategyRun]:
+        """Get a strategy run by its ID."""
+        try:
+            with self.get_session() as session:
+                return session.query(StrategyRun).filter(StrategyRun.id == run_id).first()
+        except Exception as e:
+            self.log_error(f"Error getting strategy run by ID {run_id}: {e}")
+            raise DatabaseOperationError(f"Failed to get strategy run by ID: {e}")
+    
+    def update_strategy_run(self, run_id: int, update_data: Dict[str, Any]) -> Optional[StrategyRun]:
+        """Update a strategy run's information."""
+        try:
+            with self.get_session() as session:
+                strategy_run = session.query(StrategyRun).filter(StrategyRun.id == run_id).first()
+                if strategy_run:
+                    for key, value in update_data.items():
+                        setattr(strategy_run, key, value)
+                    session.commit()
+                    session.refresh(strategy_run)
+                    self.log_info(f"Updated strategy run {run_id}")
+                    return strategy_run
+                return None
+        except Exception as e:
+            self.log_error(f"Error updating strategy run {run_id}: {e}")
+            raise DatabaseOperationError(f"Failed to update strategy run: {e}")
+    
+    def complete_strategy_run(self, run_id: int, total_signals: int) -> bool:
+        """Mark a strategy run as completed."""
+        try:
+            update_data = {
+                'status': 'completed',
+                'end_time': datetime.now(datetime.timezone.utc),
+                'total_signals': total_signals
+            }
+            result = self.update_strategy_run(run_id, update_data)
+            return result is not None
+        except Exception as e:
+            self.log_error(f"Error completing strategy run {run_id}: {e}")
+            return False
+    
+    # Strategy Signal Operations
+    def store_strategy_signals(self, run_id: int, strategy_results: List[StrategyResult]) -> int:
+        """
+        Store multiple strategy signals from strategy results.
+        
+        Args:
+            run_id: The strategy run ID these signals belong to
+            strategy_results: List of StrategyResult objects containing signals
+            
+        Returns:
+            Number of signals stored
+        """
+        try:
+            signals_stored = 0
+            with self.get_session() as session:
+                for result in strategy_results:
+                    for signal in result.signals:
+                        strategy_signal = StrategySignal(
+                            run_id=run_id,
+                            strategy_name=result.strategy_name,
+                            strategy_config=None,  # Could be populated from StrategyRun.config
+                            symbol=signal.symbol,
+                            timeframe=signal.timeframe,
+                            timestamp=signal.timestamp,
+                            signal_type=signal.signal_type.value,
+                            price=Decimal(str(signal.price)),
+                            confidence=Decimal(str(signal.confidence)),
+                            signal_metadata={
+                                'indicators_used': result.indicators_used,
+                                'metadata': signal.metadata or {}
+                            }
+                        )
+                        session.add(strategy_signal)
+                        signals_stored += 1
+                
+                session.commit()
+                self.log_info(f"Stored {signals_stored} strategy signals for run {run_id}")
+                return signals_stored
+                
+        except Exception as e:
+            self.log_error(f"Error storing strategy signals for run {run_id}: {e}")
+            raise DatabaseOperationError(f"Failed to store strategy signals: {e}")
+    
+    def get_strategy_signals(
+        self, 
+        run_id: Optional[int] = None,
+        strategy_name: Optional[str] = None,
+        symbol: Optional[str] = None,
+        timeframe: Optional[str] = None,
+        start_time: Optional[datetime] = None,
+        end_time: Optional[datetime] = None,
+        signal_type: Optional[str] = None,
+        limit: Optional[int] = None
+    ) -> List[StrategySignal]:
+        """
+        Retrieve strategy signals with flexible filtering.
+        
+        Args:
+            run_id: Filter by strategy run ID
+            strategy_name: Filter by strategy name
+            symbol: Filter by trading symbol
+            timeframe: Filter by timeframe
+            start_time: Filter signals after this time
+            end_time: Filter signals before this time
+            signal_type: Filter by signal type
+            limit: Maximum number of signals to return
+            
+        Returns:
+            List of StrategySignal objects
+        """
+        try:
+            with self.get_session() as session:
+                query = session.query(StrategySignal)
+                
+                # Apply filters
+                if run_id is not None:
+                    query = query.filter(StrategySignal.run_id == run_id)
+                if strategy_name:
+                    query = query.filter(StrategySignal.strategy_name == strategy_name)
+                if symbol:
+                    query = query.filter(StrategySignal.symbol == symbol)
+                if timeframe:
+                    query = query.filter(StrategySignal.timeframe == timeframe)
+                if start_time:
+                    query = query.filter(StrategySignal.timestamp >= start_time)
+                if end_time:
+                    query = query.filter(StrategySignal.timestamp <= end_time)
+                if signal_type:
+                    query = query.filter(StrategySignal.signal_type == signal_type)
+                
+                # Order by timestamp descending
+                query = query.order_by(desc(StrategySignal.timestamp))
+                
+                # Apply limit
+                if limit:
+                    query = query.limit(limit)
+                
+                return query.all()
+                
+        except Exception as e:
+            self.log_error(f"Error retrieving strategy signals: {e}")
+            raise DatabaseOperationError(f"Failed to retrieve strategy signals: {e}")
+    
+    def get_strategy_signal_stats(self, run_id: Optional[int] = None) -> Dict[str, Any]:
+        """Get statistics about strategy signals."""
+        try:
+            with self.get_session() as session:
+                query = session.query(StrategySignal)
+                
+                if run_id is not None:
+                    query = query.filter(StrategySignal.run_id == run_id)
+                
+                # Get basic counts by signal type
+                signal_counts = session.query(
+                    StrategySignal.signal_type,
+                    func.count(StrategySignal.id).label('count')
+                ).group_by(StrategySignal.signal_type)
+                
+                if run_id is not None:
+                    signal_counts = signal_counts.filter(StrategySignal.run_id == run_id)
+                
+                counts_dict = {signal_type: count for signal_type, count in signal_counts.all()}
+                
+                # Get total signals
+                total_signals = query.count()
+                
+                # Get average confidence
+                avg_confidence = session.query(func.avg(StrategySignal.confidence)).scalar()
+                
+                return {
+                    'total_signals': total_signals,
+                    'signal_counts': counts_dict,
+                    'average_confidence': float(avg_confidence) if avg_confidence else 0.0,
+                    'run_id': run_id
+                }
+                
+        except Exception as e:
+            self.log_error(f"Error getting strategy signal stats: {e}")
+            raise DatabaseOperationError(f"Failed to get strategy signal stats: {e}")
+    
+    # Data Retention and Cleanup
+    def cleanup_old_strategy_data(self, days_to_keep: int = 30) -> Dict[str, int]:
+        """
+        Clean up old strategy signals and runs to prevent table bloat.
+        
+        Args:
+            days_to_keep: Number of days to retain data
+            
+        Returns:
+            Dictionary with counts of deleted records
+        """
+        try:
+            cutoff_date = datetime.now(datetime.timezone.utc) - timedelta(days=days_to_keep)
+            
+            with self.get_session() as session:
+                # Delete old strategy runs (and their signals via CASCADE)
+                deleted_runs = session.query(StrategyRun).filter(
+                    StrategyRun.created_at < cutoff_date,
+                    StrategyRun.status == 'completed'  # Only delete completed runs
+                ).delete(synchronize_session=False)
+                
+                session.commit()
+                
+                self.log_info(f"Cleaned up {deleted_runs} old strategy runs and their signals")
+                return {
+                    'deleted_runs': deleted_runs,
+                    'cutoff_date': cutoff_date.isoformat()
+                }
+                
+        except Exception as e:
+            self.log_error(f"Error cleaning up old strategy data: {e}")
+            raise DatabaseOperationError(f"Failed to cleanup old strategy data: {e}")