ΠΡΠΎΠ²Π΅ΡΠΊΠ° ΡΠΈΡΡΠ΅ΠΌΡ ΡΠΏΠ»ΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΡΡΠ°ΡΠΈΠΊΠ° Π΄Π»Ρ ΠΏΡΠΎΠ²Π΅Π΄Π΅Π½ΠΈΡ A/B ΡΠ΅ΡΡΠ° ΠΈ ΡΡΡΡΠ°Π½Π΅Π½ΠΈΠ΅ ΠΎΡΠΈΠ±ΠΎΠΊ.
Π‘ΡΡΠΊ: Python (pandas, matplotlib, scipy)
ΠΠ°Π΄Π°ΡΠΈ:
- ΠΡΠΎΠ²Π΅ΡΠΊΠ° ΡΠΈΡΡΠ΅ΠΌΡ ΡΠΏΠ»ΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π½Π° Π½Π°Π»ΠΈΡΠΈΠ΅ ΠΏΠΎΠ»ΠΎΠΌΠΊΠΈ c ΠΏΠΎΠΌΠΎΡΡΡ A/A ΡΠ΅ΡΡΠ°.
- ΠΡΡΡΠ½Π΅Π½ΠΈΠ΅ ΠΏΡΠΈΡΠΈΠ½ ΠΏΠΎΠ»ΠΎΠΌΠΊΠΈ.
Π Π΅Π·ΡΠ»ΡΡΠ°ΡΡ:
- Π‘ ΠΏΠΎΠΌΠΎΡΡΡ Π/A ΡΠ΅ΡΡΠ° ΠΈ ΡΠ°Π·Π²Π΅Π΄ΡΠ²Π°ΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ Π½Π°ΡΠ΅Π» Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΡΡ ΠΏΡΠΈΡΠΈΠ½Ρ ΠΏΠΎΠ»ΠΎΠΌΠΊΠΈ.
- ΠΡΠΏΠΎΠ»ΡΠ·ΡΡ t-test ΠΈ ΡΠ΅ΡΡ ΠΠ°Π½Π½Π°-Π£ΠΈΡΠ½ΠΈ Π½Π°ΡΠ΅Π» ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈ-Π·Π½Π°ΡΠΈΠΌΡΠ΅ ΠΌΠ΅ΠΆΠ΄Ρ Π³ΡΡΠΏΠΏΠ°ΠΌΠΈ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ, ΠΏΠΎΠΊΠ°Π·Π°ΡΠ΅Π»ΠΈ ΠΊΠΎΡΠΎΡΡΡ Π΄ΠΎΠ»ΠΆΠ½Ρ Π±ΡΡΡ Π±Π»ΠΈΠ·ΠΊΠΈ ΠΊ ΡΠ°Π²Π½ΡΠΌ ΠΈ ΠΈΠ·Π²Π»Π΅ΠΊ ΡΡΠΈ Π΄Π°Π½Π½ΡΠ΅ ΠΈΠ· Π΄Π°ΡΠ°-ΡΠ΅ΡΠ°.
ΠΠΏΠΈΡΠ°Π½ΠΈΠ΅ Π΄Π°Π½Π½ΡΡ :
- uid - ID ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ
- experimentVariant - Π²Π°ΡΠΈΠ°Π½Ρ ΡΠΊΡΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½ΡΠ° (ΡΠ΅ΡΡΠΎΠ²Π°Ρ ΠΈΠ»ΠΈ ΠΊΠΎΠ½ΡΡΠΎΠ»ΡΠ½Π°Ρ Π³ΡΡΠΏΠΏΠ°)
- version - Π²Π΅ΡΡΠΈΡ ΠΌΠΎΠ±ΠΈΠ»ΡΠ½ΠΎΠ³ΠΎ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ
- purchase - ΠΏΠΎΠΊΡΠΏΠΊΠΈ
ΠΠ½ΡΠ΅ΡΠΏΡΠ΅ΡΠ°ΡΠΈΡ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ² A/B ΡΠ΅ΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈ ΡΠ΅ΡΡΠΎΠ².
Π‘ΡΡΠΊ: Python(pandas, numpy, scipy, seaborn, matplotlib)
ΠΠ°Π΄Π°ΡΠ°:
- ΠΡΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ A/B ΡΠ΅ΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΡ ΡΠ΅ΡΡΠΎΠ² ΠΈ Π²ΡΡΡΠ½ΠΈΡΡ, ΡΠ°Π·Π»ΠΈΡΠ°Π΅ΡΡΡ Π»ΠΈ ΡΠ΅Π»Π΅Π²Π°Ρ ΠΌΠ΅ΡΡΠΈΠΊΠ° Π² ΡΠ΅ΡΡΠΎΠ²ΠΎΠΉ ΠΈ ΠΊΠΎΠ½ΡΡΠΎΠ»ΡΠ½ΠΎΠΉ Π³ΡΡΠΏΠΏΠ°Ρ .
Π Π΅Π·ΡΠ»ΡΡΠ°ΡΡ:
- ΠΡΠΏΠΎΠ»ΡΠ·ΡΡ ΡΠ°Π·Π²Π΅Π΄ΡΠ²Π°ΡΠ΅Π»ΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½ΡΡ ΠΈ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΡΠ΅ΡΡΡ (ΡΠ΅ΡΡ ΠΠ΅Π²Π΅Π½Π° ΠΈ ΡΠ΅ΡΡΠ° Π¨Π°ΠΏΠΈΡΠΎ-Π£ΠΈΠ»ΠΊΠ° ΠΏΡΠΎΠ²Π΅ΡΠΈΠ» ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΡ Π² ΠΊΠΎΠ½ΡΡΠΎΠ»ΡΠ½ΠΎΠΉ ΠΈ ΡΠ΅ΡΡΠΎΠ²ΠΎΠΉ Π³ΡΡΠΏΠΏΠ°Ρ Π½Π° Π³ΠΎΠΌΠΎΠ³Π΅Π½Π½ΠΎΡΡΡ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠΈ ΠΈ Π½ΠΎΡΠΌΠ°Π»ΡΠ½ΠΎΠ΅ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅)
- Π‘ ΠΏΠΎΠΌΠΎΡΡΡ t-ΡΠ΅ΡΡΠ°, ΡΠ΅ΡΡΠ° ΠΠ°Π½Π½Π°-Π£ΠΈΡΠ½ΠΈ, Bootstrap ΡΡΠ΅Π΄Π½ΠΈΡ ΠΈ Bootstrap ΠΌΠ΅Π΄ΠΈΠ°Π½Π½ΡΡ ΠΈΠ½ΡΠ΅ΡΠΏΡΠ΅ΡΠΈΡΠΎΠ²Π°Π» ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ A/B ΡΠ΅ΡΡΠ°.
ΠΠΏΠΈΡΠ°Π½ΠΈΠ΅ Π΄Π°Π½Π½ΡΡ :
- value - ΡΡΠΌΠΌΠ° ΠΏΠΎΠΊΡΠΏΠΊΠΈ
- experimentVariant - Π²Π°ΡΠΈΠ°Π½Ρ ΡΠΊΡΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½ΡΠ° (ΠΊΠΎΠ½ΡΡΠΎΠ»ΡΠ½Π°Ρ ΠΈΠ»ΠΈ ΡΠ΅ΡΡΠΎΠ²Π°Ρ Π³ΡΡΠΏΠΏΡ)
ΠΡΡΡΠ½Π΅Π½ΠΈΠ΅ ΠΏΡΠΈΡΠΈΠ½ ΠΎΡΡΠΎΠΊΠ° Π²ΠΎΠ΄ΠΈΡΠ΅Π»Π΅ΠΉ ΠΈΠ· ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ-Π°Π³ΡΠ΅Π³Π°ΡΠΎΡΠ° ΡΠ°ΠΊΡΠΈ (churn).
Π‘ΡΡΠΊ: Python (pandas, numpy, scipy, plotly, seaborn, matplotlib)
ΠΠ°Π΄Π°ΡΠ°:
- ΠΡΡΡΠ½ΠΈΡΡ ΠΏΡΠΈΡΠΈΠ½Ρ ΠΎΡΡΠΎΠΊΠ° (churn rate) Π²ΠΎΠ΄ΠΈΡΠ΅Π»Π΅ΠΉ ΠΈΠ· Π°Π³ΡΠ΅Π³Π°ΡΠΎΡΠ° ΡΠ°ΠΊΡΠΈ ΠΈ Π΄Π°ΡΡ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°ΡΠΈΠΈ ΠΏΠΎ ΡΠ»ΡΡΡΠ΅Π½ΠΈΡ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ.
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
- Π‘ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΡ ΡΠ΅ΡΡΠΎΠ² xi2, ΠΊΡΠΈΡΠ΅ΡΠΈΡ ΠΡΠ°ΡΠΊΠ΅Π»Π°-Π£ΠΎΠ»Π»ΠΈΡΠ° ΠΈ ΡΠ΅ΡΡΠ° ΠΠ°Π½Π½Π°-Π£ΠΈΡΠ½ΠΈ Π²ΡΡΡΠ½ΠΈΠ» ΠΏΡΠΈΡΠΈΠ½Ρ ΠΎΡΡΠΎΠΊΠ° ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ.
- ΠΠ°Π» ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°ΡΠΈΠΈ ΠΏΠΎ ΡΠ»ΡΡΡΠ΅Π½ΠΈΡ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ Π΄Π»Ρ Π΄Π°Π»ΡΠ½Π΅ΠΉΡΠ΅Π³ΠΎ ΠΏΡΠΎΠ²Π΅Π΄Π΅Π½ΠΈΡ A/Π ΡΠ΅ΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ.
ΠΠΏΠΈΡΠ°Π½ΠΈΠ΅ Π΄Π°Π½Π½ΡΡ :
- city β Π³ΠΎΡΠΎΠ΄
- phone β ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠ΅ ΡΡΡΡΠΎΠΉΡΡΠ²ΠΎ, ΠΊΠΎΡΠΎΡΠΎΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Π²ΠΎΠ΄ΠΈΡΠ΅Π»Ρ
- signup_date β Π΄Π°ΡΠ° ΡΠ΅Π³ΠΈΡΡΡΠ°ΡΠΈΠΈ Π°ΠΊΠΊΠ°ΡΠ½ΡΠ° (YYYYMMDD)
- last_trip_date β Π΄Π°ΡΠ° ΠΏΠΎΡΠ»Π΅Π΄Π½Π΅ΠΉ ΠΏΠΎΠ΅Π·Π΄ΠΊΠΈ (YYYYMMDD)
- avg_dist β ΡΡΠ΅Π΄Π½Π΅Π΅ ΡΠ°ΡΡΡΠΎΡΠ½ΠΈΠ΅ (Π² ΠΌΠΈΠ»ΡΡ ) Π·Π° ΠΏΠΎΠ΅Π·Π΄ΠΊΡ Π² ΠΏΠ΅ΡΠ²ΡΠ΅ 30 Π΄Π½Π΅ΠΉ ΠΏΠΎΡΠ»Π΅ ΡΠ΅Π³ΠΈΡΡΡΠ°ΡΠΈΠΈ
- avg_rating_by_driver β ΡΡΠ΅Π΄Π½ΡΡ ΠΎΡΠ΅Π½ΠΊΠ° ΠΏΠΎΠ΅Π·Π΄ΠΎΠΊ Π²ΠΎΠ΄ΠΈΡΠ΅Π»Π΅ΠΌ
- avg_rating_of_driver β ΡΡΠ΅Π΄Π½ΡΡ ΠΎΡΠ΅Π½ΠΊΠ° ΠΏΠΎΠ΅Π·Π΄ΠΎΠΊ Π²ΠΎΠ΄ΠΈΡΠ΅Π»Ρ
- surge_pct β ΠΏΡΠΎΡΠ΅Π½Ρ ΠΏΠΎΠ΅Π·Π΄ΠΎΠΊ, ΡΠΎΠ²Π΅ΡΡΠ΅Π½Π½ΡΡ Ρ ΠΌΠ½ΠΎΠΆΠΈΡΠ΅Π»Π΅ΠΌ > 1 (ΠΊΠ°ΠΆΠ΅ΡΡΡ ΠΊΠΎΠ³Π΄Π° Π±ΠΎΠ»ΡΡΠ°Ρ Π·Π°Π³ΡΡΠΆΠ΅Π½Π½ΠΎΡΡΡ ΠΈ ΡΠ΄)
- avg_surge β ΡΡΠ΅Π΄Π½ΠΈΠΉ ΠΌΠ½ΠΎΠΆΠΈΡΠ΅Π»Ρ Π²ΡΠΏΠ»Π΅ΡΠΊΠ° Π·Π° Π²ΡΠ΅ ΠΏΠΎΠ΅Π·Π΄ΠΊΠΈ ΡΡΠΎΠ³ΠΎ Π²ΠΎΠ΄ΠΈΡΠ΅Π»Ρ
- trips_in_first_30_days β ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΏΠΎΠ΅Π·Π΄ΠΎΠΊ, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠΎΠ²Π΅ΡΡΠΈΠ» Π²ΠΎΠ΄ΠΈΡΠ΅Π»Ρ Π² ΠΏΠ΅ΡΠ²ΡΠ΅ 30 Π΄Π½Π΅ΠΉ ΠΏΠΎΡΠ»Π΅ ΡΠ΅Π³ΠΈΡΡΡΠ°ΡΠΈΠΈ
- luxury_car_user β TRUE, Π΅ΡΠ»ΠΈ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π² ΠΏΠ΅ΡΠ²ΡΠ΅ 30 Π΄Π½Π΅ΠΉ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π» ΠΏΡΠ΅ΠΌΠΈΡΠΌ-Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Ρ
- weekday_pct β ΠΏΡΠΎΡΠ΅Π½Ρ ΠΏΠΎΠ΅Π·Π΄ΠΎΠΊ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ, ΡΠΎΠ²Π΅ΡΡΠ΅Π½Π½ΡΡ Π² Π±ΡΠ΄Π½ΠΈΠ΅ Π΄Π½ΠΈ