在Unicode编码中,19968到40959的码点区间属于基本汉字区块(BMP - Basic Multilingual Plane)。但请注意,并不是这个区间中的每个码点都有对应的常用字符。
以下是如何在Python中打印该范围内所有字符的代码:
for code in range(19968, 40960):
char = chr(code)
if '\u200b' <= char <= '\uffff': # 如果字符位于Unicode的BMP内部(即范围0-65535)并且不是不可见字符
print(f"{chr(code)} {hex(code)}")
这行代码将遍历19968到40959的码点区间,使用chr()
函数将每个整数代码转换成对应的Unicode字符。然后使用格式化字符串打印每个字符及其十六进制表示。这里使用的if
语句是为了确保只打印实际可视的字符而忽略一些控制字符或者代位符(如零宽度空格 \u200b
)。需要注意的是,我们会过滤掉一些可能无效或非打印的特殊字符。