EGYADMIN commited on
Commit
9f6fd75
·
verified ·
1 Parent(s): b7aeeed

Create config/prediction_config.yaml

Browse files
Files changed (1) hide show
  1. config/prediction_config.yaml +205 -0
config/prediction_config.yaml ADDED
@@ -0,0 +1,205 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # إعدادات نماذج التوقع المستقبلي للمناقصات والمشاريع
2
+ # شركة شبه الجزيرة للمقاولات
3
+ # مهندس التطوير: م. تامر الجوهري
4
+
5
+ # إعدادات عامة
6
+ general:
7
+ company_name: "شركة شبه الجزيرة للمقاولات"
8
+ default_confidence_level: 0.95 # مستوى الثقة الافتراضي للتوقعات
9
+ timezone: "Asia/Riyadh"
10
+ language: "ar"
11
+ confidence_threshold: 0.7 # الحد الأدنى المقبول لمستوى الثقة
12
+
13
+ # إعدادات البيانات
14
+ data:
15
+ tenders_path: "data/processed/tenders.csv"
16
+ contracts_path: "data/processed/contracts.csv"
17
+ projects_path: "data/processed/projects.csv"
18
+ municipalities_path: "data/processed/municipalities.csv"
19
+ transport_path: "data/processed/transport.csv"
20
+ investment_fund_path: "data/processed/investment_fund.csv"
21
+ results_path: "data/prediction_results/"
22
+ data_update_frequency: "daily" # daily, weekly, monthly
23
+ historical_data_window: 5 # عدد السنوات للبيانات التاريخية
24
+
25
+ # إعدادات نماذج التوقع
26
+ prediction_models:
27
+ # نموذج تصنيف المناقصات
28
+ classification:
29
+ model_path: "models/trained/tender_classifier"
30
+ model_type: "transformer"
31
+ base_model: "aubmindlab/arabert-base-v2"
32
+ num_labels: 5
33
+ threshold: 0.6
34
+ categories:
35
+ - "بنية تحتية"
36
+ - "مباني"
37
+ - "طرق"
38
+ - "مياه وصرف صحي"
39
+ - "كهرباء"
40
+
41
+ # نموذج السلاسل الزمنية للتوقع المستقبلي
42
+ time_series:
43
+ model_path: "models/trained/time_series/prophet_model.json"
44
+ model_type: "prophet"
45
+ forecast_periods: 24 # عدد الأشهر للتوقع
46
+ retraining_frequency: "monthly" # تردد إعادة التدريب
47
+ seasonality:
48
+ yearly: true
49
+ weekly: true
50
+ daily: false
51
+ fiscal_year_start: 7 # شهر بداية السنة المالية (يوليو)
52
+ uncertainty_samples: 1000
53
+
54
+ # نموذج توقع المشاريع المستقبلية
55
+ project_prediction:
56
+ model_path: "models/trained/project_prediction/catboost_model"
57
+ model_type: "catboost"
58
+ categorical_features:
59
+ - "project_type"
60
+ - "sector"
61
+ - "region"
62
+ - "client_type"
63
+ - "contractor_classification"
64
+ numeric_features:
65
+ - "budget"
66
+ - "duration"
67
+ - "num_competitors"
68
+ - "local_content_percentage"
69
+ - "similar_projects_count"
70
+ - "previous_projects_count"
71
+
72
+ # نموذج التوقع المالي
73
+ financial:
74
+ model_path: "models/trained/financial/xgboost_model.json"
75
+ model_type: "xgboost"
76
+ target_metrics:
77
+ - "profit_margin"
78
+ - "cash_flow"
79
+ - "roi"
80
+ features:
81
+ - "project_size"
82
+ - "project_duration"
83
+ - "sector"
84
+ - "client_type"
85
+ - "competition_level"
86
+ - "material_costs"
87
+ - "labor_costs"
88
+
89
+ # نموذج تحليل المنافسة
90
+ competition_analysis:
91
+ model_path: "models/trained/competition/lightgbm_model.txt"
92
+ model_type: "lightgbm"
93
+ competitors_database: "data/templates/competitors_database.json"
94
+ market_share_threshold: 0.15
95
+ competitor_strength_threshold: 0.7
96
+
97
+ # إعدادات التدريب
98
+ training:
99
+ batch_size: 16
100
+ learning_rate: 2e-5
101
+ num_epochs: 5
102
+ validation_split: 0.2
103
+ early_stopping_patience: 3
104
+ max_seq_length: 512
105
+ use_mixed_precision: true
106
+ use_gpu: true
107
+ seed: 42
108
+ cross_validation_folds: 5
109
+
110
+ # إعدادات التقييم
111
+ evaluation:
112
+ evaluation_metric: "f1" # accuracy, f1, precision, recall, rmse, mae
113
+ test_size: 0.2
114
+ confidence_intervals: true
115
+ confusion_matrix: true
116
+ feature_importance: true
117
+ output_metrics:
118
+ - "accuracy"
119
+ - "precision"
120
+ - "recall"
121
+ - "f1"
122
+ - "r2"
123
+ - "mae"
124
+
125
+ # إعدادات الجهات الحكومية
126
+ government_entities:
127
+ # صندوق الاستثمارات العامة
128
+ investment_fund:
129
+ name: "صندوق الاستثمارات العامة"
130
+ api_endpoint: "https://api.pif.gov.sa/tenders"
131
+ projects_database: "data/government/pif_projects.csv"
132
+ forecast_weight: 0.35
133
+ sectors:
134
+ - "سياحة وترفيه"
135
+ - "تقنية المعلومات"
136
+ - "طاقة متجددة"
137
+ - "لوجيستيات"
138
+ - "تطوير عقاري"
139
+
140
+ # البلديات
141
+ municipalities:
142
+ name: "البلديات"
143
+ api_endpoint: "https://api.momrah.gov.sa/municipalities"
144
+ projects_database: "data/government/municipalities_projects.csv"
145
+ forecast_weight: 0.25
146
+ regions:
147
+ - "الرياض"
148
+ - "مكة المكرمة"
149
+ - "المدينة المنورة"
150
+ - "الشرقية"
151
+ - "عسير"
152
+ - "تبوك"
153
+ - "حائل"
154
+ - "القصيم"
155
+ - "جازان"
156
+ - "نجران"
157
+ - "الباحة"
158
+ - "الجوف"
159
+ - "الحدود الشمالية"
160
+
161
+ # وزارة النقل
162
+ transport:
163
+ name: "و��ارة النقل"
164
+ api_endpoint: "https://api.mot.gov.sa/tenders"
165
+ projects_database: "data/government/transport_projects.csv"
166
+ forecast_weight: 0.25
167
+ project_types:
168
+ - "طرق"
169
+ - "جسور"
170
+ - "أنفاق"
171
+ - "مطارات"
172
+ - "موانئ"
173
+ - "سكك حديدية"
174
+
175
+ # جهات أخرى
176
+ other_entities:
177
+ name: "جهات حكومية أخرى"
178
+ projects_database: "data/government/other_projects.csv"
179
+ forecast_weight: 0.15
180
+
181
+ # إعدادات تصدير التوقعات
182
+ export:
183
+ formats:
184
+ - "csv"
185
+ - "excel"
186
+ - "pdf"
187
+ - "json"
188
+ report_template: "data/templates/prediction_report_template.docx"
189
+ logo_path: "web/assets/logos/peninsula_logo.png"
190
+ include_charts: true
191
+ include_tables: true
192
+ include_executive_summary: true
193
+
194
+ # إعدادات الإشعارات
195
+ notifications:
196
+ enabled: true
197
+ channels:
198
+ - "email"
199
+ - "dashboard"
200
+ - "mobile"
201
+ high_potential_threshold: 0.8 # عتبة المشاريع ذات الاحتمالية العالية
202
+ notification_frequency: "daily" # daily, weekly
203
+ recipients:
204
205