Вивчайте Ефективні Операції зі Строками | Підвищення Продуктивності За Допомогою Вбудованих Інструментів

Свайпніть щоб показати меню

Ефективне об'єднання рядків

Під час роботи з великою кількістю рядків важливо використовувати найбільш ефективний спосіб об'єднання. Використання оператора + (+=) багаторазово є неефективним для великих наборів даних, оскільки кожного разу створюється новий рядок. Натомість, використання методу str.join() значно швидше та економніше щодо пам'яті.

Порівняймо продуктивність двох підходів до об'єднання рядків із символами нового рядка в один рядок. Перший використовує цикл for з оператором +=, а другий застосовує більш ефективний метод str.join().


              1234567891011121314151617181920212223
            
import os
decorators = os.system('wget https://staging-content-media-cdn.codefinity.com/courses/8d21890f-d960-4129-bc88-096e24211d53/section_1/chapter_3/decorators.py 2>/dev/null')
from decorators import timeit_decorator

# Simulated lines of a report
lines = [f"Line {i}" for i in range(1, 1000001)]

# Inefficient concatenation
@timeit_decorator(number=50)
def concat_with_plus():
    result = ""
    for line in lines:
        result += line + "\n"
    return result

# Efficient concatenation
@timeit_decorator(number=50)
def concat_with_join():
    return "\n".join(lines) + "\n"  # Add final newline for consistency

result_plus = concat_with_plus()
result_join = concat_with_join()
print(result_plus == result_join)

Попередня компіляція регулярних виразів

Під час роботи з регулярними виразами продуктивність може стати проблемою, особливо при обробці великих наборів даних або багаторазовому пошуку за шаблоном. У таких випадках попередня компіляція шаблону є корисною оптимізаційною технікою.

Попередня компіляція гарантує, що рушій регулярних виразів не перекомпілює шаблон щоразу при його використанні, що може суттєво підвищити продуктивність, коли один і той самий шаблон застосовується багаторазово до набору даних. Такий підхід особливо корисний у випадках фільтрації, валідації або пошуку у великих текстових файлах.

Порівняймо продуктивність двох підходів для валідації імен користувачів за допомогою регулярних виразів. Перший підхід використовує функцію re.match із шаблоном, визначеним безпосередньо кожного разу при виклику. Другий, більш ефективний підхід, попередньо компілює шаблон регулярного виразу за допомогою re.compile і повторно використовує його для всіх перевірок.


              1234567891011121314151617181920212223
            
import os
import re
decorators = os.system('wget https://staging-content-media-cdn.codefinity.com/courses/8d21890f-d960-4129-bc88-096e24211d53/section_1/chapter_3/decorators.py 2>/dev/null')
from decorators import timeit_decorator

# Simulated usernames
usernames = ["user123", "admin!@#", "test_user", "invalid!"] * 100000

# Naive approach
@timeit_decorator(number=10)
def validate_with_re():
    pattern = r"^\w+$"
    return [bool(re.match(pattern, username)) for username in usernames]

# Optimized approach
@timeit_decorator(number=10)
def validate_with_compiled_re():
    compiled_pattern = re.compile(r"^\w+$")
    return [bool(compiled_pattern.match(username)) for username in usernames]

result_without_precompiling = validate_with_re()
result_with_precompiling = validate_with_compiled_re()
print(result_without_precompiling == result_with_precompiling)

1. Ви генеруєте звіт із `10000` рядків, де кожен рядок представляє підсумок транзакції. Який метод є найефективнішим для об'єднання цих рядків в один рядок із символом `;` між ними?

2. Чому попередня компіляція регулярного виразу за допомогою `re.compile()` часто швидша, ніж використання `re.match()` з вбудованим шаблоном?

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 3. Розділ 4

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 3. Розділ 4

Ефективні Операції зі Строками

Ефективне об'єднання рядків

Попередня компіляція регулярних виразів

2. Чому попередня компіляція регулярного виразу за допомогою re.compile() часто швидша, ніж використання re.match() з вбудованим шаблоном?

2. Чому попередня компіляція регулярного виразу за допомогою `re.compile()` часто швидша, ніж використання `re.match()` з вбудованим шаблоном?