欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java基础教程(21)--泛型

程序员文章站 2023-12-06 13:57:40
泛型是Java SE 5.0中新增的特性,它的本质是类型参数化,也就是说将参数看作是一个类型。这意味着我们在定义泛型类型时无需指定具体的类型,而在使用泛型类型的时候可以根据需要去指定不同的类型。使用泛型可以编写更加灵活和高效的代码。本文将对泛型进行详细的介绍。 ......

一.为什么使用泛型

  泛型意味着编写的代码可以被很多不同类型的对象所重用。例如,我们不希望为存放string和integer对象的集合设计不同的类。现在的arraylist类可以存放任何类型的对象,但是在java中增加泛型之前已经有了一个arraylist类,它是使用继承来实现泛型的。这个arraylist类只维护一个object数组:

public class arraylist {
    private object [] elementdata ;
    public object get (int i) {...}
    public void add (object o) {...}
}

  这样存在两个问题。第一是可以向集合中添加任何对象:

arraylist collection = new arraylist();
collection.add(new integer(0));
collection.add("string");

  第二是在获取值时必须进行强制类型转换:

integer i0 = (integer)collection.get(0);

  如果我们默认这个集合是用来存放integer对象的,那么下面的类型转换可以通过编译,但是在运行时会产生错误:

integer i1 = (integer)collection.get(1);

  泛型提供了一个更好的解决方案:类型参数。现在的arraylist类有一个类型参数用来指示元素的类型:

arraylist<integer> collection = new arraylist<integer>();

  这使得代码具有更好的可读性,一看就知道这个集合中存放的是integer对象。

注:在java se 7及以后的版本中,构造函数中可以省略泛型类型。也就是说,上面的语句实际上可以这么写:

arraylist<integer> collection = new arraylist<>();

  编译器也可以很好地利用这个信息。当调用get的时候,不需要进行强制类型转换,编译器就知道返回值类型是integer,而不是object:

integer i0 = collection.get(0);

  而且,在插入元素时编译器会进行检査,避免插人错误类型的对象。例如:

collection.add("string");

  这句代码是无法通过编译的。出现编译错误比运行时出现类的强制类型转换异常要好得多。类型参数的魅力在于可以使程序具有更好的可读性和安全性。

二.泛型类型

  泛型类型就是将参数类型化的类或接口。就是具有一个或多个类型参数的类。我们先定义一个简单的box类,然后使用泛型对它进行改造。

1.一个简单的box类

  我们可以将box类看作是一个盒子,它可以用来存放一个对象。这里我们使用一个object类型的成员变量来存放对象,并且需要提供两个方法:一个是将对象放入盒子的set方法,另一个是获取盒子中的对象的get方法。

public class box {
    private object object;

    public void set(object object) { this.object = object; }
    public object get() { return object; }
}

  由于它内部维护的是一个object对象的引用,因此你可以放入任何类型的对象。但是当你取出对象时,你必须进行强制类型转换。这样就会存在一个问题,如果你存入的对象类型与你转换的类型不一致,将会在运行时出现异常,但是编译器却无法在编译时期发现这个问题。例如:

box b = new box();
b.set("box");
integer i = (integer) b.get();

  上面的代码可以通过编译,但是会在运行的时候抛出一个classcastexception。

2.使用泛型的box类

  泛型类使用如下的语法定义:

class classname<t1, t2, ..., tn> {...}

  类名后面是类型参数(也称类型变量),使用一对尖括号<>括起来,一个类中可以有多个类型参数。
  下面是使用泛型改造后的box类:

public class box<t> {
    private t t;

    public void set(t t) { this.t = t; }
    public t get() { return t; }
}

  所有的object都被替换成了类型变量t。在使用时,类型变量可以是任何非基本数据类型。
  泛型接口的语法与泛型类类似:

interface interfacename<t1, t2, ..., tn> {...}

3.类型参数的命名惯例

  按照惯例,类型参数名称是单个大写字母。这与我们已经了解的变量命名规范有很大的出入,但是这有充分的理由:如果没有这种约定,就很难区分类型变量和类或接口的名称。
  下面是最常用的类型参数的名称:

  • e - 元素(广泛应用于集合中)
  • k - 键
  • v - 值
  • n - 数字
  • t - 类型
  • s,u,v等 - 第二、第三、第四类型

4.调用和实例化泛型类型

  要在代码中使用box类,必须执行泛型类型调用,也就是将t替换为具体的类型,比如integer:

box<integer> integerbox;

  你可以把泛型类型调用看作是普通的方法调用,但是不同于将参数传递给方法,泛型类型调用将类型参数(在这个例子中是integer)传递给泛型类。
  正如其他的变量声明一样,上面的代码并没有创建box对象,它只是声明了一个可以引用装有integer对象的box对象的引用。
  泛型类型调用也被称作是类型参数化。
  要实例化这个类,可以像实例化其他类一样使用new关键字,但是要在类名和小括号之间加上<integer>:

box<integer> integerbox = new box<integer>();

5.钻石运算符

  在java se 7及以后的版本中,在调用泛型类的构造方法时可以省略尖括号中的类型参数,这对尖括号被称为钻石运算符。例如,你可以使用下面的语句来实例化box<integer>:

box<integer> integerbox = new box<>();

6.原始类型

  原始类型是指没有类型参数的泛型类或接口。例如下面的泛型类box:

public class box<t> {
    public void set(t t) { /* ... */ }
    // ...
}

  要创建一个类型参数化的box,需要为类型参数t提供一个实际的类型:

box<integer> intbox = new box<>();

  如果没有提供实际的类型,将会创建一个box的原始类型:

box rawbox = new box();

  因此,box就是box的原始类型。但是,非泛型类或接口不是原始类型。
  原始类型多出现在遗留代码中,这是因为很多类或接口(例如集合类)在jdk 5.0之前不是泛型的。在使用原始类型时,你实际上已经获得了预泛型行为。为了向后兼容,允许将一个参数化的类型赋值给原始类型:

box<string> stringbox = new box<>();
box rawbox = stringbox;           // ok

  但是如果你把原始类型赋值给参数化的类型,就会产生警告:

box rawbox = new box();           // rawbox is a raw type of box<t>
box<integer> intbox = rawbox;     // warning: unchecked conversion

  如果使用原始类型调用泛型类型中定义的使用了泛型的方法,也会产生警告:

box<string> stringbox = new box<>();
box rawbox = stringbox;
rawbox.set(8);                    // warning: unchecked invocation to set(t)

  警告显示原始类型将会绕过泛型类型检查,将不安全代码的捕获推迟到运行时。因此,应该避免使用原始类型。

三.泛型方法

  泛型方法是指引入了自己独有的类型参数的方法。这类似于声明泛型类型,但类型参数的使用范围仅限于声明它的方法。允许使用静态和非静态泛型方法,以及泛型构造方法。
  定义泛型方法时,要将使用尖括号包围的类型参数列表放在修饰符之后,返回值之前。
  下面的util类中定义了一个泛型方法compare,这个方法可以用来比较两个pair对象:

public class util {
    public static <k, v> boolean compare(pair<k, v> p1, pair<k, v> p2) {
        return p1.getkey().equals(p2.getkey()) && p1.getvalue().equals(p2.getvalue());
    }
}

class pair<k, v> {
    private k key;
    private v value;
    public pair(k key, v value) {
        this.key = key;
        this.value = value;
    }
    public void setkey(k key) { this.key = key; }
    public void setvalue(v value) { this.value = value; }
    public k getkey()   { return key; }
    public v getvalue() { return value; }
}

  调用该方法的语法如下:

pair<integer, string> p1 = new pair<>(1, "apple");
pair<integer, string> p2 = new pair<>(2, "pear");
boolean same = util.<integer, string>compare(p1, p2);

  上面的代码中显式提供了类型参数。一般来说,可以省略类型参数,编译器将会自动推断出需要的类型。

pair<integer, string> p1 = new pair<>(1, "apple");
pair<integer, string> p2 = new pair<>(2, "pear");
boolean same = util.compare(p1, p2);

  这个特性被称为类型推断,允许将泛型方法作为普通方法调用,而无需在尖括号之间指定类型。我们稍后将会进一步讨论有关类型推断的内容。
  构造方法也可以是泛型方法,并且非泛型类也可以拥有泛型构造方法,例如:

class myclass {
    <t> myclass(t t) {
        ...
    }
}

四.有界类型参数

  有时你可能希望限制类型参数的类型。例如,对数字进行操作的方法可能只想接受number及其子类的实例。这正是有界类型参数的用途。
  要声明有界类型参数,需要在类型参数后面使用extends关键字,然后跟上这个类型参数的上界。需要注意的是,在这种情况下,extends既可以用于表示继承(对于类而言),又可以用于表示实现(对于接口而言)。

public class box<t> {
    private t t;

    public void set(t t) {
        this.t = t;
    }
    public t get() {
        return t;
    }
    public <u extends number> void inspect(u u){
        system.out.println("t: " + t.getclass().getname());
        system.out.println("u: " + u.getclass().getname());
    }
    public static void main(string[] args) {
        box<integer> integerbox = new box<integer>();
        integerbox.set(new integer(10));
        integerbox.inspect("some text"); // error: argument must be number or its subclass
    }
}

  上面的程序将会编译失败,因为inspect方法只接受number类及它的子类的实例作为参数。
  一个类型参数可以有多个上界:

<t extends b1 & b2 & b3>

  如果一个类型参数有多个上界,那么这些上界中最多只能有一个类,并且这个类必须是列表中的第一个:

class a { /* ... */ }
interface b { /* ... */ }
interface c { /* ... */ }

class d <t extends a & b & c> { /* ... */ }

  如果a没有放在第一个,将会产生一个编译错误。

五.泛型,继承和子类型

  正如我们所知,可以将子类的实例赋值给父类类型的变量。例如,可以将integer类的实例赋值给number类型的变量,因为integer是number的子类。

number somenumber = new integer(10);

  在泛型中也是如此,例如:

box<number> box = new box<number>();
box.set(new integer(10));

  现在考虑以下方法:

public void boxtest(box<number> n) { /* ... */ }

  这个方法接受一个box类型的参数。我们是否可以传递box或box类型的参数呢?答案是否定的。因为box和box不是box的子类。在使用泛型编程时,这是一个常见的误解,但这是一个需要学习的重要概念。
Java基础教程(21)--泛型
  给定两个具体类型a和b(例如,number和integer),myclass<a>与myclass<b>无关,无论a和b是否相关。myclass<a>和myclass<b>的公共父类是object。
  两个泛型类型的关系是通过它们之间的继承(或实现)语句确定的,而不是通过类型参数之间的关系确定的。只要两个泛型类型之间存在继承(或实现)关系,并且不改变类型参数,就会在类型之间保留子类型关系。
  使用arraylist类作为示例。arraylist实现了list接口,而list接口又继承了collection接口。所以arraylist是list和collection的子类型,list是collection的子类型。只要不改变参数类型,他们之间就存在子类型关系:
Java基础教程(21)--泛型
  现在假设我们要定义一个自己的接口payloadlist,它继承自list接口,同时引入了新的类型参数p:

interface payloadlist<e,p> extends list<e> {
  void setpayload(int index, p val);
  ...
}

  只要我们保证传递给类型参数e的类型和list一致,无论传递给p的类型是什么,这个接口都是list的子类型,例如:

  • payloadlist<string,string>
  • payloadlist<string,integer>
  • payloadlist<string,exception>

Java基础教程(21)--泛型

六.类型推断

  类型推断是java编译器的一种根据方法调用和对应的声明来推断类型参数的具体类型的能力。类型推断试图找到适用于所有参数的最贴切的类型。例如:

static <t> t pick(t a1, t a2) { return a2; }
serializable s = pick("d", new arraylist<string>());

  在上面的例子中,t将会被推断为serializable类型。因为a1是string类型,a2是arraylist类型,因此编译器将会寻找它们的共同超类型,也就是serializable类型。

1.类型推断和泛型方法

  在泛型方法中我们已经提到了类型推断,它使我们能够像调用普通方法一样调用泛型方法,而无需在尖括号之间指定类型。考虑下面的例子:

public class boxdemo {
    public static <u> void addbox(u u, list<box<u>> boxes) {
        box<u> box = new box<>();
        box.set(u);
        boxes.add(box);
    }
    public static <u> void outputboxes(list<box<u>> boxes) {
        int counter = 0;
        for (box<u> box: boxes) {
            u boxcontents = box.get();
            system.out.println("box #" + counter + " contains [" + boxcontents.tostring() + "]");
            counter++;
        }
    }
    public static void main(string[] args) {
        arraylist<box<integer>> listofintegerboxes = new arraylist<>();
        boxdemo.<integer>addbox(integer.valueof(10), listofintegerboxes); // statement 1
        boxdemo.addbox(integer.valueof(20), listofintegerboxes);          // statement 2
        boxdemo.outputboxes(listofintegerboxes);
    }
}

  上面的例子输出如下:

box #0 contains [10]
box #1 contains [20]

  泛型方法addbox定义了一个类型参数u。当调用addbox时,在方法前面的尖括号中放入具体的类型,正如上面的statement 1:

boxdemo.<integer>addbox(integer.valueof(10), listofintegerboxes);

  不过,大多数情况下,编译器可以根据方法调用来推断出类型参数的具体类型,因此可以省略方法名后面的尖括号和类型,正如上面的statement 2:

boxdemo.addbox(integer.valueof(20), listofintegerboxes);

2.类型推断和构造方法

  在泛型类和非泛型类中,都可以包含泛型构造方法(换句话说就是可以引入它们自己的类型参数)。首先我们看一个泛型类的例子:

class myclass<x> {
    <t> myclass(t t) {
        ...
    }
}

  首先需要明确一点的是,在实例化一个泛型类时,构造方法后面的尖括号里的参数列表与声明泛型类时类名后的尖括号里的参数列表是一一对应的,也就是说,无论构造方法是不是泛型方法,它都是提供给泛型类引入的类型参数使用的。这与普通的泛型方法不一样,普通的泛型方法在调用时尖括号中的参数是提供给该方法使用的。这就意味着,如果一个泛型类包含泛型构造方法,那么在实例化该泛型类时,无论构造方法后的尖括号中是否省略了类型参数列表,该构造方法始终需要推断出自己引入的类型参数的具体类型。因此,可以像下面这样实例化上面的泛型类:

myclass<integer> myobject1 = new myclass<integer>("obj1"); // statement 1
myclass<integer> myobject2 = new myclass<>("obj2");        // statement 2

  上面的statement 1中,构造方法后面提供了x的类型,因此无需推断,但由于无法提供t的类型,因此编译器需要从构造方法的参数中推断出其类型string;在statement 2中,x和t的类型都没有提供,因此均需要推断。
  下面再来看一个非泛型类的例子:

class myclass {
    <t> myclass(t t) {
        ...
    }
}

  因为这是一个非泛型类,在实例化时构造方法后面不能使用尖括号,因此仍然无法提供该泛型构造方法需要的类型信息,那么t的类型必须通过推断得出:

myclass myobject = new myclass("obj");

  经过类型推断可以得出t的类型是string。

七.通配符

  在泛型程序设计中,问号(?)被称为通配符,它表示未知的类型。通配符可以被用在很多场景中:参数、域或局部变量的类型,有时候也用在返回值类型中(不过更好的编程实践是使用具体的返回值类型)。下面将更详细地讨论通配符。

1.上界通配符

  可以使用上界通配符来放宽对变量的限制。例如,如果你的方法接受的参数是一个list,它里面的元素可以是number以及它的子类的实例,你可以使用上界通配符来实现这一点。
  要声明一个上界通配符,在尖括号中使用?,后面跟上extends关键字和它的上界。在这种情况下,extends既可以用于表示继承(对于类而言),又可以用于表示实现(对于接口而言)。
  要编写适用于number及其子类类型的集合的方法,你可以指明list<? extends number>。list<number>比list<? extends number>更严格,因为前者只接受number类型的集合,而后者可以接受number及其子类类型的集合。
  下面的sumoflist方法返回一个集合中的数字的总和:

public static double sumoflist(list<? extends number> list) {
    double s = 0.0;
    for (number n : list)
        s += n.doublevalue();
    return s;
}

  以下的代码使用了一个integer集合,将会输出sum = 6.0:

list<integer> li = arrays.aslist(1, 2, 3);
system.out.println("sum = " + sumoflist(li));

  下面的代码使用了double集合,将会输出sum = 7.0:

list<double> ld = arrays.aslist(1.2, 2.3, 3.5);
system.out.println("sum = " + sumoflist(ld));

2.*通配符

  *通配符只用到了问号(?),例如list<?>。在以下两种场景中*通配符很有用:

  • 对于通配符表示的类型,你编写的方法只用到了来自object类的方法。
  • 你的代码只使用到了泛型类中不依赖于类型参数的方法,例如list的size()和clear()方法。

  考虑以下方法:

public static void printlist(list<object> list) {
    for (object elem : list)
        system.out.println(elem + " ");
    system.out.println();
}

  printlist的目标是打印任何类型的集合,但它无法实现该目标,因为它只能打印object类型的集合。它不能打印list<integer>,list<string>,list<double>等,因为它们不是list<object>的子类型。要编写通用的printlist方法,需要使用list<?>:

public static void printlist(list<?> list) {
    for (object elem: list)
        system.out.print(elem + " ");
    system.out.println();
}

  对于任意的具体类型a,list<a>是list<?>的子类型,可以使用printlist打印任何类型的集合:

list<integer> li = arrays.aslist(1, 2, 3);
list<string>  ls = arrays.aslist("one", "two", "three");
printlist(li);
printlist(ls);

  要注意的是,list<object>和list<?>并不一样。list<object>中可以插入任意类型的对象,而list<?>中只能插入null。

3.下界通配符

  与上界通配符类似,下界通配符将类型参数限制为某个特定类型及它的超类型。不过需要注意的是,不能同时指定通配符的上界和下界。要声明一个下界通配符,在尖括号中使用?,后面跟上super关键字和它的下界。
  假设我们要编写一个将integer对象放入集合的方法。为了最大限度地提高灵活性,我们希望该方法可以处理list<integer>,list<number>和list<object>,也就是任何可以保存integer值的集合。
  要编写适用于integer及其超类型的集合的方法,你可以指明list<? super integer>。list<integer>比list<? super integer>更严格,因为前者只接受integer类型的集合,而后者可以接受integer及其超类型的集合。
  下面的代码将数字1~10添加到指定的集合中:

public static void addnumbers(list<? super integer> list) {
    for (int i = 1; i <= 10; i++) {
        list.add(i);
    }
}

3.通配符和子类型

  正如第五小节《泛型,继承和子类型》中描述的那样,泛型类或接口之间的关系与类型参数并没有直接联系。然而,可以使用通配符在泛型类或接口之间创建关系。
  观察以下代码:

integer i = new integer(1);
number n = i;

  上面的代码是合理的。这个例子展示了常规类的继承规则:如果类b继承了类a,则类b是类a的子类型。但是这条规则在泛型类型中并不成立:

list<integer> li = new arraylist<>();
list<number> ln = li;   // compile-time error

  integer是number的子类型,那么list<integer>和list<number>之间到底是什么关系?
Java基础教程(21)--泛型
  尽管integer是number的子类型,但list<integer>不是list<number>的子类型。list<integer>和list<number>的公共超类型是list<?>。
  如果不好理解,可以回想一下面向对象程序设计中对于继承的定义。在面向对象程序设计中,继承是通过is-a来体现的。可以这么说,如果b is a a,那么a就是b的超类型。例如,任何对象都是一个object,因此object是所有类的超类型。
  现在我们回过头来看list<integer>和list<number>,list<integer>表示一个integer类型的集合,list<number>是一个number类型的集合,这两个集合中的元素不是同一种类型。因此,尽管number是integer的超类型,但却不能说一个integer类型的集合是一个number类型的集合,也就是说list<number>不是list<integer>的超类型。
  再来说说这两个集合和list<?>。list<?>表示一个任何类型元素的集合,既然可以表示任何元素的集合,自然也就可以表示integer类型的集合和number类型的集合。下面的代码是合理的:

list<integer> li = new arraylist<>();
list<number> ln = new arraylist<>();
list<?> l1 = li;
list<?> l2 = ln;

  在理解了这个概念之后,我们就可以判断使用通配符的泛型类型之间的关系了。下面的图片展示了几个使用通配符的list之间的关系,大家可以试着自己理解:
Java基础教程(21)--泛型

4.通配符捕获

  下面的rebox方法将元素从box中取出并重新放回:

public class box<t> {
    private t value;

    public t get() {
        return value;
    }

    public void set(t value) {
        this.value = value;
    }

    public static void rebox(box<?> box) {
        box.set(box.get());
    }
}

  这段代码看上去应该可以运行,因为取出的值和放回的值是相同类型的。但是,在编译时却会产生以下错误信息:
Java基础教程(21)--泛型
  在我们讨论这个错误之前,我们首先来区分一下通配符(?)和类型参数(以下使用t来说明)的区别。虽然它们都用来表示未知的类型,但是类型参数t会在第一次用到它的时候就确定下来,之后程序中的所有类型参数t都代表这个类型;而通配符?则不同,程序中出现的每个通配符都会获得不同的捕获,编译器会为每个通配符的捕获分配不同的名称,因为任意未知的类型参数之间并没有关系。
  现在上面出现的错误提示就很容易理解了。rebox方法的box参数是box<?>类型的,那么编译器会将它的set方法的参数标记为cap#1,将它的get方法的返回值标记为cap#2,由于编译器并不知道cap#1与cap#2是否相同(虽然在这里它们就是相同的),因此就会出现上面的错误信息。
  那么是不是rebox方法的功能就无法实现了呢?实际上,这里我们可以借助一个辅助方法:

public static void rebox(box<?> box) {
    reboxhelper(box);
}

private static <t> void reboxhelper(box<t> box) {
    box.set(box.get());
}

  现在rebox方法什么也没做,只是将box参数原封不动地传递给reboxhelper方法。当reboxhelper方法接收到这个参数的时候,类型参数t就会捕获通配符所代表的类型,之后的所有t都代表了这个类型,也就不会出现类型转换所带来的问题。
  当然这里的例子只是为了演示通配符捕获这个概念,并没有什么意义。实际上可以直接将rebox定义为泛型方法:

public static <t> void rebox(box<t> box) {
    box.set(box.get());
}

5.通配符使用指南

  在使用泛型进行编程时,令人困惑的一个方面是确定何时使用通配符以及使用哪种类型的通配符。下面提供了几条编码时要遵循的一些指导原则。
  首先我们应该考虑该使用泛型的变量属于哪种类型:

  • in变量:“in”变量将数据提供给代码。假设有一个带两个参数的的复制方法copy(src,dest),src参数提供需要被复制的数据,因此它是“in”变量。
  • out变量:“out”变量用于保存其他地方的数据。在复制方法copy(src,dest)中,dest参数接受数据,所以它是“out”变量。

  当然,一些变量既属于“in”变量也属于“out”变量,这种情况在下面的准则中也有说明。
  下面是几条选择通配符类型时的准则:

  • “in”变量使用上界通配符
  • “out”变量使用下界通配符
  • 在只需要使用object类中定义的方法访问“in”变量的情况下,使用*通配符
  • 若该变量既属于“in”变量,又属于“out”变量,不使用通配符

  不过,这些准则并不适用于方法的返回类型。应避免使用通配符作为返回类型,因为它强制程序员使用代码来处理通配符。

八.类型擦除

  java中引入泛型的目的是提供更严格的编译时类型检查,以及更好地支持泛型程序设计。但是对于虚拟机而言,并不存在泛型,所有的类都是普通类。在编译时,编译器会将类型参数擦除,并替换为它的限定类型或object。类型擦除确保不为参数化类型创建新的类,因此泛型并不会产生运行时开销。

1.泛型类型的擦除

  考虑下面单链表中的节点类:

public class node<t> {
    private t data;
    private node<t> next;

    public node(t data, node<t> next) {
        this.data = data;
        this.next = next;
    }

    public t getdata() { return data; }
    // ...
}

  因为类型参数t没有限制,所以java编译器会将其替换为object。也就是说,编译后的node类应该是下面这样的:

public class node {
    private object data;
    private node next;

    public node(object data, node next) {
        this.data = data;
        this.next = next;
    }

    public object getdata() { return data; }
    // ...
}

  在下面的例子中,node类使用了有界类型参数:

public class node<t extends comparable<t>> {
    private t data;
    private node<t> next;

    public node(t data, node<t> next) {
        this.data = data;
        this.next = next;
    }

    public t getdata() { return data; }
    // ...
}

  java编译器会将有界类型参数t替换为它的限定类型comparable:

public class node {
    private comparable data;
    private node next;

    public node(comparable data, node next) {
        this.data = data;
        this.next = next;
    }

    public comparable getdata() { return data; }
    // ...
}

2.泛型方法的擦除

  java编译器也会擦除泛型方法中的类型参数。考虑以下的泛型方法,这个方法用来统计一个元素在数组中的出现次数:

public static <t> int count(t[] anarray, t elem) {
    int cnt = 0;
    for (t e : anarray) {
        if (e.equals(elem)) {
            ++cnt;
        }   
    }
    return cnt; 
}

  因为类型参数t没有限制,所以java编译器会将其替换为object:

public static int count(object[] anarray, object elem) {
    int cnt = 0;
    for (object e : anarray) {
        if (e.equals(elem)) {
            ++cnt;
        }   
    }
    return cnt; 
}

  假设有以下的几个类:

class shape { /* ... */ }
class circle extends shape { /* ... */ }
class rectangle extends shape { /* ... */ }

  你可以编写一个泛型方法来绘制不同的图形:

public static <t extends shape> void draw(t shape) { /* ... */ }

  这个方法将会被编译为:

public static void draw(shape shape) { /* ... */ }

3.桥接方法

  考虑下面的node类和mynode类:

public class node<t> {
    public t data;
    public node(t data) { this.data = data; }
    public void setdata(t data) {
        system.out.println("node.setdata");
        this.data = data;
    }
}

public class mynode extends node<integer> {
    public mynode(integer data) { super(data); }
    public void setdata(integer data) {
        system.out.println("mynode.setdata");
        super.setdata(data);
    }
}

  mynode类继承了参数化的node类,也就是node<integer>。那么,擦除类型之后的node类和mynode类应该是:

public class node {
    public object data;
    public node(object data) { this.data = data; }
    public void setdata(object data) {
        system.out.println("node.setdata");
        this.data = data;
    }
}

public class mynode extends node {
    public mynode(integer data) { super(data); }
    public void setdata(integer data) {
        system.out.println("mynode.setdata");
        super.setdata(data);
    }
}

  mynode类重写了node<integer>的setdata方法,但经过编译器的类型擦除后,node<integer>类并不存在,mynode继承的类也变成了node类。此时,mynode类的setdata方法和node类的setdata方法的参数列表并不相同,并不符合重写的定义。也就是说,我们在编写代码时设计的重写经过编译器的类型擦除后就消失了。为了保持重写的语义和保留多态性,编译器会自动生成一个桥接方法。对于mynode类来说,编译器将会为setdata生成下面的桥接方法:

public class mynode extends node {
    public mynode(integer data) { super(data); }

    // bridge method generated by the compiler
    public void setdata(object data) {
        setdata((integer) data);
    }
    public void setdata(integer data) {
        system.out.println("mynode.setdata");
        super.setdata(data);
    }
}

  泛型接口也是如此。考虑下面的泛型接口和实现类:

public interface demointerface<t> {
    void foo(t t);
}

public class demointerfaceimpl implements demointerface<string> {
    void foo(string s) {
        // ...
    }
}

  经过类型擦除后,demointerface和demointerfaceimpl将会变成:

public interface demointerface {
    void foo(object t);
}

public class demointerfaceimpl implements demointerface {
    void foo(string s) {
        // ...
    }
}

  我们知道,实现类必须重写接口中所有的抽象方法。但是demointerfaceimpl中的foo(string s)方法并没有重写demointerface中的foo(object t)方法,这显然违背了继承的原则。此时,编译器也会在编译时自动生成桥接方法:

public class demointerfaceimpl implements demointerface {
    public void foo(object t) {
        foo((string) t);
    }
    public void foo(string s) {
        // ...
    }
}

4.不可具体化类型

  可具体化类型是指类型信息在运行时完全可用的类型。这包括基本类型,非泛型类型,原始类型和使用了*通配符的类型。
  不可具体化类型是指那些类型信息在编译期被擦除的类型,也就是没有使用*通配符定义的泛型类型。我们无法在运行时获取一个不可具体化类型的所有信息。例如list<number>和list<string>,jvm在运行时无法区分它们。

1.堆污染

  当一个参数化类型的变量引用了一个对象,而这个对象的类型并不是该参数化类型时,就会产生堆污染。如果一个程序执行了一些在编译时会出现非受检警告的操作时,就会出现这种情况。非受检警告既有可能出现在编译时(在编译时类型检查规则的限制下),也有可能出现在运行时无法保证涉及参数化类型操作(例如类型转换或方法调用)的正确性。例如,将原始类型和参数化类型混合使用时,或者执行了一个未受检的类型转换时,堆污染就会发生。
  在正常情况下,当所有代码同时被编译后,编译器就会对潜在的堆污染发出一个警告以引起你的关注。如果你分模块对代码进行编译,那就很难检测出潜在的堆污染。如果你确定代码编译后没有产生警告,那么堆污染就不会发生。

2.具有不可具体化形参的可变参数方法的潜在隐患

  具有可变参数的泛型方法可以引起堆污染。考虑下面的arraybuilder类:

public class arraybuilder {
    public static <t> void addtolist (list<t> listarg, t... elements) {
        for (t x : elements) {
            listarg.add(x);
        }
    }
    public static void faultymethod(list<string>... l) {
        object[] objectarray = l;
        objectarray[0] = arrays.aslist(42);
        string s = l[0].get(0);
    }
}

  下面的heappollutionexample使用了arraybuiler类:

public class heappollutionexample {
    public static void main(string[] args) {
        list<string> stringlista = new arraylist<string>();
        list<string> stringlistb = new arraylist<string>();

        arraybuilder.addtolist(stringlista, "seven", "eight", "nine");
        arraybuilder.addtolist(stringlistb, "ten", "eleven", "twelve");
        list<list<string>> listofstringlists = new arraylist<list<string>>();
        arraybuilder.addtolist(listofstringlists, stringlista, stringlistb);

        arraybuilder.faultymethod(arrays.aslist("hello!"), arrays.aslist("world!"));
    }
}

  编译时,arraybuilder.addtolist方法会产生这样的警告:

warning: [varargs] possible heap pollution from parameterized vararg type t

  当编译遇到可变参数方法时,它会将可变参数翻译成一个数组。在方法arraybuilder.addlist中,编译器将可变形参t... elements翻译成t[] elements。然而,由于类型擦除,编译器又将t[] elements转化为object[] elements。这样就存在堆污染的可能性。
  下面的语句把可变形参l赋值给object数组objectargs:

object[] objectarray = l;

  这个语句也会潜在地引起堆污染。一个不匹配可变形参l的参数化类型的值可以被赋值给变量l,也就可以赋值给objectarray。然而,编译器并不会在这一句上生成未受检警告。在将可变形参list<string> l翻译成形参list[] l时,编译就已经生成了一个警告。这一句是有效的,因为变量l是list[]类型,它同时也是object[]的子类。
  因此,如果你像如下语句那样,把一个任何类型的list对象赋值给objectarray数组的任何一个元素时,编译器也不会报任何警告或错误。

objectarray[0] = arrays.aslist(42);

  这个语句将objectarray的第一个元素赋值为一个list对象,这个list持有一个integer元素。
  当你通过下面的语句去调用arraybuilder.faultymetho方法时,就会抛出一个classcastexception异常:

string s = l[0].get(0);

  l数组中的第一个元素存储了一个list类型的对象,但是这一句期望的类型却是list

3.避免来自不可具体化形参的可变参数方法的警告

  如果你定义了一个具有参数化类型参数的可变参数方法,并且确保你的方法不会抛出一个classcastexception异常或其他因对可变形参处理不当而引起的相似异常时,你就可以通过在静态或非构造方法上使用@safevarargs注解来人为地屏蔽编译器生成的这些警告。这个注释断言此方法的实现会合理地处理可变形参。
  如果你还想同时屏蔽非受检警告,可以像下面这样:

@suppresswarnings({"unchecked", "varargs"})

九.泛型的限制

  为了更有效地使用泛型,你必须了解下面这些限制:

1.不能使用基本类型实例化泛型类型

  考虑下面的参数化类型:

class pair<k, v> {
    private k key;
    private v value;

    public pair(k key, v value) {
        this.key = key;
        this.value = value;
    }
    // ...
}

  在创建pair对象的时候,不能使用基本类型来替换k或v:

pair<int, char> p = new pair<>(8, 'a');  // compile-time error

  不过可以使用它们的包装类来代替,编译器会对它们进行自动装箱:

pair<integer, character> p = new pair<>(8, 'a');

2.不能创建类型参数的实例

  不能创建类型参数的实例。例如,下面的代码将会导致一个编译错误:

public static <e> void append(list<e> list) {
    e elem = new e();  // compile-time error
    list.add(elem);
}

3.不能使用类型参数声明静态域

  因为静态域在类加载时就已经创建,而类型参数在实例化类时才会指定。因此不能使用类型参数声明静态域。下面的代码也会导致编译错误:

public class mobiledevice<t> {
    private static t os;
    // ...
}

4.不能对类型参数使用类型转换或instanceof

  因为编译器擦除了所有的类型参数,因此你不能在运行时判断泛型类型使用的是什么类型参数:

public static <e> void rtti(list<e> list) {
    if (list instanceof arraylist<integer>) {  // compile-time error
        // ...
    }
}

  运行时并不能区分arraylist<integer>和arraylist<string>。你能做的就是使用*通配符来判断list是不是一个arraylist:

public static void rtti(list<?> list) {
    if (list instanceof arraylist<?>) {  // ok; instanceof requires a reifiable type
        // ...
    }
}

  不能对类型参数进行类型转换,除非这个类型参数是*通配符。例如:

list<integer> li = new arraylist<>();
list<number>  ln = (list<number>) li;  // compile-time error

5.不能创建类型参数的数组

  不能实例化参数化类型的数组,例如:

pair<string>[] table = new pair<string>[10]; // error

  这又什么问题呢?擦除之后,table的类型是pair[]。可以把它转换成object[]:

object[] objarray = table;

  数组会记住它的元素类型,如果试图存储其他类型的元素,就会抛出一个arraystoreexception异常:

objarray[0] = "hello";  // error--component type is pair

  不过对于泛型类型,擦除会使这种机制失效。以下赋值:

objarray[0] = new pair<integer>();

  能够通过数组存储检查,但仍然会导致一个错误。出于这个原因,不允许创建参数化类型的数组。
  需要说明的是,只是不允许创建这些数组,而声明类型为pair<string>[]的变量仍是合法的。不过不能用new pair<string>[10]初始化这个变量。

6.不能抛出或捕获泛型类的实例

  既不能抛出也不能捕获泛型类对象。实际上,甚至泛型类扩展throwable都是不合法的。例如,以下定义就不能正常编译:

public class problem<t>extends exception { ... }  // error--can't extend throwable

  不过,在异常规范中使用类型变量是允许的。以下方法是合法的:

public static <t extends throwable> void dowork(t t) throws t { // ok
    try {
        // ...
    } cathe (throwable realcause) {
        t.initcause(realcause);
        throw t;
    }
}

7.不能重载擦除类型后参数列表相同的方法

  一个类不能有两个在类型擦除后具有相同签名的方法:

public class example {
    public void print(set<string> strset) { }
    public void print(set<integer> intset) { }
}