Bây giờ là lúc ta làm chủ một trong những loại dữ liệu xuất hiện gần như ở mọi chương trình Python: chuỗi (string). Đây không chỉ là chuyện “xử lý văn bản” mà còn là nền tảng của mọi thao tác dữ liệu từ nhập liệu, đọc file, đến API và hiển thị giao diện.
Chuỗi – nền tảng của mọi dữ liệu
Từ cái tên, địa chỉ, email, nội dung chat, cho đến dữ liệu trong file .txt
, .json
hay dữ liệu đọc từ web API – hầu hết đều là chuỗi. Vì thế, nếu bạn muốn trở thành lập trình viên thực chiến, bạn phải biết thao tác với chuỗi một cách linh hoạt.
Trong bài này, bạn sẽ học cách:
- Cắt chuỗi, nối chuỗi
- Tìm kiếm, thay thế, đếm
- Làm sạch chuỗi người dùng nhập vào
- Định dạng chuỗi cho giao diện đẹp, rõ ràng
Ôn lại: Tạo và in chuỗi
ten = "python cơ bản"
print(ten)
Bạn cũng có thể dùng dấu nháy đơn '
hoặc ba nháy '''
để viết chuỗi nhiều dòng.
Cắt chuỗi (slice)
s = "Python"
print(s[0]) # P
print(s[-1]) # n
print(s[1:4]) # yth
print(s[:3]) # Pyt
print(s[::2]) # Pto
Nối chuỗi
ho = "Nguyễn"
ten = "An"
hoten = ho + " " + ten
print(hoten)
Lặp qua chuỗi
for c in "hello":
print(c)
Một số hàm chuỗi phổ biến
Hàm | Mô tả |
---|---|
len(s) | Độ dài chuỗi |
s.lower() | In thường toàn bộ |
s.upper() | In hoa toàn bộ |
s.title() | Viết hoa chữ cái đầu mỗi từ |
s.strip() | Xóa khoảng trắng đầu/cuối |
s.replace(a, b) | Thay thế a bằng b |
s.find(sub) | Vị trí đầu tiên của sub (hoặc -1) |
s.count(sub) | Đếm số lần xuất hiện sub |
s.isdigit() | Kiểm tra toàn chuỗi có phải số |
Ví dụ:
email = " HOCpython@GMAIL.com "
clean = email.strip().lower()
print(clean) # hocpython@gmail.com
Chia và nối chuỗi
s = "một,hai,ba,bốn"
ds = s.split(",") # ['một', 'hai', 'ba', 'bốn']
s2 = "-".join(ds) # 'một-hai-ba-bốn'
Kiểm tra chuỗi
ten = "python"
print("py" in ten) # True
print(ten.startswith("py")) # True
print(ten.endswith("on")) # True
Định dạng chuỗi (format
)
ten = "Lan"
tuoi = 18
print("Chào {}, bạn {} tuổi".format(ten, tuoi))
print(f"Chào {ten}, bạn {tuoi} tuổi") # f-string (Python 3.6+)
Một số thao tác nâng cao
a. Xoay ngược chuỗi:
s = "python"
print(s[::-1]) # nohtyp
b. Loại bỏ dấu câu:
import string
s = "Xin chào, bạn khỏe không?"
for ch in string.punctuation:
s = s.replace(ch, "")
print(s) # Xin chào bạn khỏe không
Bài tập luyện tập
Bài 1: Nhập vào tên người dùng, chuẩn hóa:
- Viết hoa chữ cái đầu
- Xóa khoảng trắng đầu/cuối
Bài 2: Viết hàm kiểm tra email có chứa @
và kết thúc bằng .com
Bài 3: Nhập một đoạn văn, đếm số lần xuất hiện của từ "python"
(không phân biệt hoa/thường)
Bài 4: Nhập chuỗi số (VD: "12345"
) → chuyển thành danh sách [1,2,3,4,5]
Bài 5: Viết hàm đảo ngược thứ tự từ trong câu:
"tôi đang học python" → "python học đang tôi"
Kết luận
Xử lý chuỗi là một trong những kỹ năng bắt buộc phải thành thạo nếu bạn muốn xử lý văn bản, dữ liệu, giao diện hay người dùng nhập vào. Python cung cấp rất nhiều công cụ để bạn làm việc với chuỗi một cách nhanh gọn và rõ ràng.
Bài tiếp theo: Bài 15 – Import thư viện và sử dụng thư viện ngoài
Bạn sẽ học cách chia chương trình thành nhiều file, sử dụng thư viện dựng sẵn (như math
, random
, datetime
), và cách cài thư viện từ bên ngoài để làm những việc mạnh mẽ hơn như: gửi email, làm giao diện, gọi API, phân tích dữ liệu…
Thảo luận