“标准查询运算符”是组成语言集成查询 (LINQ) 模式的方法。大多数这些方法都在序列上运行,其中的序列是一个对象,其类型实现了IEnumerable<T> 接口或 IQueryable<T> 接口。标准查询运算符提供了包括筛选、投影、聚合、排序等功能在内的查询功能。
各个标准查询运算符在执行时间上有所不同,具体情况取决于它们是返回单一值还是值序列。返回单一值的方法(例如 Average 和 Sum)会立即执行。返回序列的方法会延迟查询执行,并返回一个可枚举的对象。
对于在内存中集合上运行的方法(即扩展 IEnumerable<T> 的方法),返回的可枚举对象将捕获传递到方法的参数。在枚举该对象时,将使用查询运算符的逻辑,并返回查询结果。
与之相反,扩展 IQueryable<T> 的方法不会实现任何查询行为,但会生成一个表示要执行的查询的表达式树。查询处理由源 IQueryable<T> 对象处理。
标准查询运算符方法的 LINQ to Objects 实现采用两种主要方式之一来执行:立即执行和延迟执行。采用延迟执行的查询运算符可以进一步分为两类:流式和非流式。
1.执行方式
(1)立即: 立即执行意味着在代码中声明查询的位置读取数据源并执行运算。 返回单个不可枚举的结果的所有标准查询运算符都立即执行。
(2)延迟: 延迟执行意味着不在代码中声明查询的位置执行运算。 仅当对查询变量进行枚举操作时才执行运算,例如通过使用 foreach 语句。这意味着查询的执行结果取决于执行查询而非定义查询时的数据源内容。如果多次枚举查询变量,则每次结果可能都不同。几乎所有返回类型为 IEnumerable<T> 或 IOrderedEnumerable<TElement> 的标准查询运算符都以延迟方式执行。
采用延迟执行方式的查询运算符可以另外分类为流式和非流式。
①流式运算符不需要在生成元素前读取所有源数据。在执行时,流式运算符一边读取每个源元素,一边对该源元素执行运算,并在可行时生成元素。流式运算符将持续读取源元素直到可以生成结果元素。这意味着可能要读取多个源元素才能生成一个结果元素。
②非流式运算符必须读取所有源数据才能生成结果元素。诸如排序和分组等运算属于此类别。在执行时,非流式查询运算符读取所有源数据,将其放入数据结构中,执行运算,然后生成结果元素。
排序操作按一个或多个特性对序列的元素进行排序。第一个排序条件对元素执行主要排序。通过指定第二个排序条件,可以对各个主要排序组中的元素进行排序。
下图演示对一个字符序列执行按字母排序操作的结果。
方法名 | 说明 | C# 查询表达式语法 |
OrderBy | 按升序对值进行排序。 | orderby |
OrderByDescending | 按降序对值进行排序。 | orderby … descending |
ThenBy | 按升序执行次要排序。 | orderby …, … |
ThenByDescending | 按降序执行次要排序。 | orderby …, … descending |
Reverse | 颠倒集合中的元素的顺序。 | X |
示例:
- 1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
- 2 var query = from word in words
- 3 orderby word.Length
- 4 select word;
- 5
- 6 foreach (var word in query)
- 7 {
- 8 Console.WriteLine(word);
- 9 }
- 1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
- 2 var query = from word in words
- 3 orderby word.Substring(0,1) descending
- 4 select word;
- 5
- 6 foreach (var word in query)
- 7 {
- 8 Console.WriteLine(word);
- 9 }
- 1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
- 2 var query = from word in words
- 3 orderby word.Length, word.Substring(0, 1)
- 4 select word;
- 5
- 6 foreach (var word in query)
- 7 {
- 8 Console.WriteLine(word);
- 9 }
- 1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
- 2 var query = from word in words
- 3 orderby word.Length, word.Substring(0, 1) descending
- 4 select word;
- 5
- 6 foreach (var word in query)
- 7 {
- 8 Console.WriteLine(word);
- 9 }
LINQ 中的 Set 操作是指根据相同或不同集合中是否存在等效元素来生成结果集的查询操作。
方法名 | 说明 | C# 查询表达式语法 |
Distinct | 从集合移除重复值。 | X |
Except | 返回差集,差集是指位于一个集合但不位于另一个集合的元素。 | X |
Intersect | 返回交集,交集是指同时出现在两个集合中的元素。 | X |
Union | 返回并集,并集是指位于两个集合中任一集合的唯一的元素。 | X |
图解 Set 操作
(1)Distinct: 返回的序列包含输入序列的唯一元素。
(2)Except: 返回的序列只包含位于第一个输入序列但不位于第二个输入序列的元素。
(3)Intersect: 返回的序列包含两个输入序列共有的元素。
(4)Union: 返回的序列包含两个输入序列的唯一的元素。
筛选指将结果集限制为只包含某些满足指定条件的元素的操作。它又称为选择。
下图演示了对字符序列进行筛选的结果。筛选操作的谓词指定字符必须为“A”。
方法名 | 说明 | C# 查询表达式语法 |
OfType | 根据值强制转换为指定类型的能力选择值。 | X |
Where | 选择基于谓词函数的值。 | where |
示例:
- 1 string[] words = { "the", "quick", "brown", "fox", "jumps" };
- 2
- 3 var query = from word in words
- 4 where word.Length == 3
- 5 select word;
- 6
- 7 foreach (var word in query)
- 8 {
- 9 Console.WriteLine(word);
- 10 }
限定符运算返回一个 Boolean 值,该值指示序列中是否有一些元素满足条件或是否所有元素都满足条件。
下图描述了两个不同源序列上的两个不同限定符运算。第一个运算询问是否有一个或多个元素为字符“A”,结果为 true。第二个运算询问是否所有元素都为字符“A”,结果为 true。
方法名 | 说明 | C# 查询表达式语法 |
All | 确定是否序列中的所有元素都满足条件。 | X |
Any | 确定序列中是否有元素满足条件。 | X |
Contains | 确定序列是否包含指定的元素。 | X |
投影是指将对象转换为一种新形式的操作,该形式通常只包含那些将随后使用的属性。通过使用投影,您可以构建依据每个对象生成的新类型。您可以映射属性,并对该属性执行数学函数。还可以在不更改原始对象的情况下映射该对象。
方法名 | 说明 | C# 查询表达式语法 |
Select | 映射基于转换函数的值。 | select |
SelectMany | 映射基于转换函数的值序列,然后将它们展平为一个序列。 | 使用多个 from 子句 |
示例
- 1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
- 2 var query = from word in words
- 3 select word.Substring(0,1);
- 4
- 5 foreach (var word in query)
- 6 {
- 7 Console.WriteLine(word);
- 8 }
- 1 var phrases = new List<string>() { "an apple a day", "the quick brown fox" };
- 2
- 3 var query = from phrase in phrases
- 4 from word in phrase.Split(' ')
- 5 select word;
- 6
- 7 foreach (var word in query)
- 8 {
- 9 Console.WriteLine(word);
- 10 }
Select() 和 SelectMany() 的工作都是依据源值生成一个或多个结果值。Select() 为每个源值生成一个结果值。因此,总体结果是一个与源集合具有相同元素数目的集合。与之相反,SelectMany() 将生成单一总体结果,其中包含来自每个源值的串联子集合。作为参数传递到 SelectMany() 的转换函数必须为每个源值返回一个可枚举值序列。然后,SelectMany() 将串联这些可枚举序列以创建一个大的序列。
下面两个插图演示了这两个方法的操作之间的概念性区别。在每种情况下,假定选择器(转换)函数从每个源值中选择一个由花卉数据组成的数组。
下图描述 Select() 如何返回一个与源集合具有相同元素数目的集合。
下图描述 SelectMany() 如何将中间数组序列串联为一个最终结果值,其中包含每个中间数组中的每个值。
示例
下面的示例比较 Select() 和 SelectMany() 的行为。代码将通过从源集合的每个花卉名称列表中提取前两项来创建一个“花束”。在此示例中,转换函数 Select 使用的“单一值”本身就是一个值集合。这需要额外的 foreach 循环,以便枚举每个子序列中的每个字符串。
- 1 static void Main(string[] args)
- 2 {
- 3 var bouquets = new List<Bouquet>()
- 4 {
- 5 new Bouquet {Flowers = new List<string> {"sunflower", "daisy", "daffodil", "larkspur"}},
- 6 new Bouquet {Flowers = new List<string> {"tulip", "rose", "orchid"}},
- 7 new Bouquet {Flowers = new List<string> {"gladiolis", "lily", "snapdragon", "aster", "protea"}},
- 8 new Bouquet {Flowers = new List<string> {"larkspur", "lilac", "iris", "dahlia"}}
- 9 };
- 10
- 11 IEnumerable<List<string>> query1 = bouquets.Select(bq => bq.Flowers);
- 12 IEnumerable<string> query2 = bouquets.SelectMany(bq => bq.Flowers);
- 13
- 14 Console.WriteLine("query1 - Select():");
- 15 foreach (IEnumerable<string> collection in query1)
- 16 {
- 17 foreach (var item in collection)
- 18 {
- 19 Console.WriteLine(item);
- 20 }
- 21 }
- 22
- 23 Console.WriteLine("\nquery2 - SelectMany():");
- 24 foreach (var item in query2)
- 25 {
- 26 Console.WriteLine(item);
- 27 }
- 28
- 29 Console.Read();
- 30 }
- 31
- 32 class Bouquet
- 33 {
- 34 public List<string> Flowers { get; set; }
- 35 }
LINQ 中的分区指的是在不重新排列元素的情况下,将输入序列划分为两部分,然后返回其中一个部分的操作。
下图显示对一个字符序列执行三个不同的分区操作的结果。第一个操作返回序列中的前三个元素。第二个操作跳过前三个元素,返回剩余的元素。第三个操作跳过序列中的前两个元素,返回接下来的三个元素。
运算符名称 | 说明 | C# 查询表达式语法 |
Skip | 跳过序列中的指定位置之前的元素。 | X |
SkipWhile | 基于谓词函数跳过元素,直到某元素不再满足条件。 | X |
Take | 提取序列中的指定位置之前的元素。 | X |
TakeWhile | 基于谓词函数提取元素,直到某元素不再满足条件。 | X |
将两个数据源“联接”就是将一个数据源中的对象与另一个数据源中共享某个通用特性的对象关联起来。
当查询所面向的数据源相互之间具有无法直接领会的关系时,联接就成为一项重要的运算。在面向对象的编程中,这可能意味着在未建模对象之间进行关联,例如对单向关系进行反向推理。下面是单向关系的一个示例:Customer 类有一个类型为 City 的属性,但 City 类没有作为 Customer 对象集合的属性。如果你具有一个 City 对象列表,并且要查找每个城市中的所有客户,则可以使用联接运算完成此项查找。
LINQ 框架中提供的联接方法包括 Join 和 GroupJoin。这些方法执行同等联接,即根据两个数据源的键是否相等来匹配这两个数据源的联接。(与此相较,Transact-SQL 支持除“等于”之外的联接运算符,例如“小于”运算符。)用关系数据库术语表达,就是说 Join 实现了内部联接,这种联接只返回那些在另一个数据集中具有匹配项的对象。GroupJoin 方法在关系数据库术语中没有直接的等效项,但它实现了内部联接和左外部联接的超集。左外部联接是这样一种联接:它返回第一个(左)数据源的每个元素,即使该元素在另一个数据源中没有关联元素。
下图显示了一个概念性视图,其中包含两个集合以及这两个集合中的包含在内部联接或左外部联接中的元素。
方法名 | 描述 | C# 查询表达式语法 |
Join | 根据键选择器函数联接两个序列并提取值对。 | join … in … on … equals … |
GroupJoin | 根据键选择器函数联接两个序列,并对每个元素的结果匹配项进行分组。 | join … in … on … equals … into … |
分组指将数据放入组中以便每个组中的元素共享公共特性的操作。
下图显示了对字符序列进行分组的结果。每个组的键是字符。
方法名 | 说明 | C# 查询表达式语法 |
GroupBy | 对共享公共特性的元素进行分组。 每个组都由一个 IGrouping<TKey, TElement> 对象表示。 | group … by - 或 - group … by … into … |
ToLookup | 根据键选择器函数将元素插入到 Lookup<TKey, TElement>(一个一对多字典)中。 | X |
- 1 var numbers = new List<int>() { 35, 44, 200, 84, 3987, 4, 199, 329, 446, 208 };
- 2
- 3 IEnumerable<IGrouping<bool, int>> query = from number in numbers
- 4 group number by number % 2 == 0;
- 5
- 6 foreach (var group in query)
- 7 {
- 8 Console.WriteLine($"{(group.Key ? "偶数" : "基数")}:");
- 9 foreach (var i in group)
- 10 {
- 11 Console.WriteLine(i);
- 12 }
- 13 }
生成是指创建新的值序列。
方法名 | 说明 | C# 查询表达式语法 |
DefaultIfEmpty | 将空集合替换为具有默认值的单一实例集合。 | X |
Empty | 返回空集合。 | X |
Range | 生成包含数字序列的集合。 | X |
Repeat | 生成包含一个重复值的集合。 | X |
如果两个序列的对应元素相等且这两个序列具有相同数量的元素,则视这两个序列相等。
方法名 | 说明 | C# 查询表达式语法 |
SequenceEqual | 通过成对地比较元素确定两个序列是否相等。 | X |
元素操作从一个序列返回单个特定元素。
方法名 | 说明 | C# 查询表达式语法 |
ElementAt | 返回集合中指定索引处的元素。 | X |
ElementAtOrDefault | 返回集合中指定索引处的元素;如果索引超出范围,则返回默认值。 | X |
First | 返回集合中的第一个元素或满足条件的第一个元素。 | X |
FirstOrDefault | 返回集合中的第一个元素或满足条件的第一个元素。 如果没有这样的元素,则返回默认值。 | X |
Last | 返回集合中的最后一个元素或满足条件的最后一个元素。 | X |
LastOrDefault | 返回集合中的最后一个元素或满足条件的最后一个元素。 如果没有这样的元素,则返回默认值。 | X |
Single | 返回集合中的唯一元素或满足条件的唯一元素。 | X |
SingleOrDefault | 返回集合中的唯一元素或满足条件的唯一元素。 如果没有这样的元素或集合不是正好包含一个元素,则返回默认值。 | X |
转换方法更改输入对象的类型。
LINQ 查询中的转换运算可用于各种应用程序。下面是一些示例:
(1)Enumerable.AsEnumerable<TSource> 方法可用于隐藏类型的标准查询运算符的自定义实现。
(2)Enumerable.OfType<TResult> 方法可用于启用非参数化集合以进行 LINQ 查询。
(3)Enumerable.ToArray<TSource>、Enumerable.ToDictionary<TSource, TKey>、Enumerable.ToList<TSource> 和 Enumerable.ToLookup<TSource, TKey> 方法可用于强制立即执行查询,而非推迟到枚举查询时。
方法名 | 说明 | C# 查询表达式语法 |
AsEnumerable | 返回类型为 IEnumerable<T> 的输入。 | X |
AsQueryable | 将(泛型)IEnumerable 转换为(泛型)IQueryable。 | X |
Cast | 将集合的元素强制转换为指定类型。 | 使用显式类型化的范围变量。 例如: from string str in words |
OfType | 根据值强制转换为指定类型的能力筛选值。 | X |
ToArray | 将集合转换为数组。 此方法强制执行查询。 | X |
ToDictionary | 根据键选择器函数将元素放入 Dictionary<TKey, TValue> 中。 此方法强制执行查询。 | X |
ToList | 将集合转换为 List<T>。 此方法强制执行查询。 | X |
ToLookup | 根据键选择器函数将元素放入 Lookup<TKey, TElement>(一对多字典)中。 此方法强制执行查询。 | X |
示例:
- 1 static void Main(string[] args)
- 2 {
- 3 var plants = new Plant[]
- 4 {
- 5 new CarnivorousPlant {Name = "Venus Fly Trap", TrapType = "Snap Trap"},
- 6 new CarnivorousPlant {Name = "Pitcher Plant", TrapType = "Pitfall Trap"},
- 7 new CarnivorousPlant {Name = "Sundew", TrapType = "Flypaper Trap"},
- 8 new CarnivorousPlant {Name = "Waterwheel Plant", TrapType = "Snap Trap"}
- 9 };
- 10
- 11 var query = from CarnivorousPlant plant in plants
- 12 where plant.TrapType == "Snap Trap"
- 13 select plant;
- 14
- 15 foreach (var carnivorousPlant in query)
- 16 {
- 17 Console.WriteLine(carnivorousPlant.Name);
- 18 }
- 19
- 20 Console.Read();
- 21 }
- 22
- 23 class Plant
- 24 {
- 25 public string Name { get; set; }
- 26 }
- 27
- 28 class CarnivorousPlant : Plant
- 29 {
- 30 public string TrapType { get; set; }
- 31 }
串联是指将一个序列追加到另一个序列的运算。
下图演示对两个字符序列执行的串联运算。
方法名 | 说明 | C# 查询表达式语法 |
Concat | 串联两个序列以组成一个序列。 | X |
聚合运算从值集合计算单个值。从一个月的日温度值计算日平均温度就是聚合运算的一个示例。
下图显示了对一个数字序列执行两个不同聚合运算的结果。第一个运算对这些数字执行求和。第二个运算返回该序列中的最大值。
方法名 | 说明 | C# 查询表达式语法 |
Aggregate | 对集合值执行自定义聚合运算。 | X |
Average | 计算值集合的平均值。 | X |
Count | 对集合中的元素进行计数,还可以仅对满足某一谓词函数的元素进行计数。 | X |
LongCount | 对大型集合中的元素进行计数,还可以仅对满足某一谓词函数的元素进行计数。 | X |
Max | 确定集合中的最大值。 | X |
Min | 确定集合中的最小值。 | X |
Sum | 计算集合中值的总和。 | X |