Skip to content

Project Structure

Understanding the ComProScanner codebase organization.

Directory Structure

comproscanner
├── src
│   └── comproscanner
│       ├── article_processors
│       │   ├── __init__.py
│       │   ├── elsevier_processor.py
│       │   ├── iop_processor.py
│       │   ├── pdfs_processor.py
│       │   ├── springer_processor.py
│       │   └── wiley_processor.py
│       ├── extract_flow
│       │   ├── crews
│       │   │   ├── materials_data_identifier_crew/
│       │   │   ├── composition_crew
│       │   │   │   ├── composition_extraction_crew/
│       │   │   │   └── composition_format_crew/
│       │   │   └── synthesis_crew
│       │   │       ├── synthesis_extraction_crew/
│       │   │       └── synthesis_format_crew/
│       │   ├── tools
│       │   │   ├── __init__.py
│       │   │   ├── material_parser_tool.py
│       │   │   └── rag_tool.py
│       │   ├── __init__.py
│       │   └── main_extraction_flow.py
│       ├── metadata_extractor
│       │   ├── __init__.py
│       │   ├── fetch_metadata.py
│       │   └── filter_metadata.py
│       ├── post_processing
│       │   ├── evaluation
│       │   │   ├── eval_flow
│       │   │   │   ├── crews
│       │   │   │   │   ├── composition_evaluation_crew/
│       │   │   │   │   └── synthesis_evaluation_crew/
│       │   │   │   ├── __init__.py
│       │   │   │   └── eval_flow.py
│       │   │   ├── __init__.py
│       │   │   └── semantic_evaluator.py
│       │   ├── visualization
│       │   │   ├── __init__.py
│       │   │   ├── create_knowledge_graph.py
│       │   │   ├── data_distribution_visualizers.py
│       │   │   └── eval_plot_visualizers.py
│       │   ├── __init__.py
│       │   └── data_cleaner.py
│       ├── utils/
│       ├── __init__.py
│       ├── comproscanner.py
│       ├── data_visualizer.py
│       └── eval_visualizer.py
├── assets/
├── docs/
├── examples/
├── tests/
├── .env
├── .gitignore
├── CHANGELOG.md
├── CONTRIBUTING.md
├── LICENSE
├── README.md
├── mkdocs.yml
├── paper-dependencies.txt
└── pyproject.toml

Module Dependencies

graph TB
    A[ComProScanner] --> B[Metadata Extractor]
    A --> C[Article Processors]
    A --> D[Extract Flow]
    A --> E[Post Processing]

    B --> F[Utils/Configs]
    C --> F
    D --> F

    E --> G[Data Visualizer]
    E --> H[Eval Visualizer]